mozun2020 2022-04-02 15:56
浏览 28
已结题

kaldi中test_microphone对录制语音进行预处理

部署kaldi进行离线语音识别,调用接口为test_microphone.py,但当环境噪声影响时,易出现噪声引起的误识别字符

希望在录音数据进入kaldi语言识别模型之前进行去噪处理,即语音增强,降低噪声对实时语音识别的干扰

查询有关资料,找到soja-box-master工具中有enhance_speech语音增强的例程,实测了一下,确实有点效果,但kaldi是直接取录音设备队列数据,soja_box_master是对wav语音文件进行处理,希望有熟悉python或者语音信号处理的同学可以将soja-box-master中enhance_speech算法集成到kaldi的test_microphone中

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 专家修改了标签 4月18日
    • 系统已结题 4月10日
    • 创建了问题 4月2日

    悬赏问题

    • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
    • ¥15 数据可视化Python
    • ¥15 要给毕业设计添加扫码登录的功能!!有偿
    • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
    • ¥15 微信公众号自制会员卡没有收款渠道啊
    • ¥15 stable diffusion
    • ¥100 Jenkins自动化部署—悬赏100元
    • ¥15 关于#python#的问题:求帮写python代码
    • ¥20 MATLAB画图图形出现上下震荡的线条
    • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘