部署kaldi进行离线语音识别,调用接口为test_microphone.py,但当环境噪声影响时,易出现噪声引起的误识别字符
希望在录音数据进入kaldi语言识别模型之前进行去噪处理,即语音增强,降低噪声对实时语音识别的干扰
查询有关资料,找到soja-box-master工具中有enhance_speech语音增强的例程,实测了一下,确实有点效果,但kaldi是直接取录音设备队列数据,soja_box_master是对wav语音文件进行处理,希望有熟悉python或者语音信号处理的同学可以将soja-box-master中enhance_speech算法集成到kaldi的test_microphone中