目前在做DEEPSPEECH中的模型推理任务,目前已有训练好的LSTM模型,模型的输入shape为(1,16,19,26),其中第二维的16表示的是时间序列。
但是我不清楚的是,在DEEPSPEECH中的推理文件中,给定的输入shape是(1,145,19,26),该输入第二维表示该wav文件的长度,并不是模型要求的16,那么它怎么可以输入到模型中的呢?
下面是DEEPSPEECH的推理文件图片
下面是pb模型图
目前在做DEEPSPEECH中的模型推理任务,目前已有训练好的LSTM模型,模型的输入shape为(1,16,19,26),其中第二维的16表示的是时间序列。
但是我不清楚的是,在DEEPSPEECH中的推理文件中,给定的输入shape是(1,145,19,26),该输入第二维表示该wav文件的长度,并不是模型要求的16,那么它怎么可以输入到模型中的呢?
下面是DEEPSPEECH的推理文件图片
下面是pb模型图