kaldi中test_microphone对录制语音进行预处理

部署kaldi进行离线语音识别，调用接口为test_microphone.py，但当环境噪声影响时，易出现噪声引起的误识别字符

希望在录音数据进入kaldi语言识别模型之前进行去噪处理，即语音增强，降低噪声对实时语音识别的干扰

查询有关资料，找到soja-box-master工具中有enhance_speech语音增强的例程，实测了一下，确实有点效果，但kaldi是直接取录音设备队列数据，soja_box_master是对wav语音文件进行处理，希望有熟悉python或者语音信号处理的同学可以将soja-box-master中enhance_speech算法集成到kaldi的test_microphone中

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

kaldi在做实时线上语音识别系统遇到问题 linux 人工智能语音识别
2023-04-10 20:54

回答 2 已采纳该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：根据输出的错误信息，可以看出在运行时遇到了两个问题： 1. "tar: online-data.tar.bz2：无法 open:
kaldi运行aishell1的时候遇到steps/train_mono.sh: line 79: train_cmd: command not found的问题 linux 语音识别
2023-04-08 09:48

回答 1 已采纳当在运行Kaldi的Aishell1示例时，遇到steps/train_mono.sh: line 79: train_cmd: command not found错误，通常是由于Kaldi的命令和脚
kaldi使用生成G.fst报错 linux 语音识别
2023-03-31 21:23

回答 1 已采纳这个错误通常是因为缺少OpenFst工具库中的命令行工具arpa2fst导致的。arpa2fst是将ARPA格式语言模型转换为FST二进制格式的工具。您需要确保安装了OpenFst库，最好是在命令行中
kaldi语音识别资料.rar_kaldi_kaldi pdf 0.7_kaldi资料_语音识别
2022-07-13 22:25

基于kaldi的语音识别小系统搭建以及kaldi的全部资料
Kaldi aishell訓練自己的資料 linux python
2022-07-19 18:09

回答 1 已采纳 kaldiaishell2数据集训练以及生成文件详细分析（步骤+部分代码解释） - 百度文库
声纹识别，选择pytorch好还是kaldi？ c++ pytorch 开发语言
2021-11-08 14:54

回答 2 已采纳比较推荐pytorch，因为C++比较复杂,环境配置也容易出错，对研究生科研而言，python相对简单，；而且pytorch也可以调用kaldi pytorch-kald
Kaldi中aishell语料训练结果（kaldi_aishell_exp.txt）
2021-07-22 17:38

包含mono、tri1、tri2、tri3a、tri4a、tri5a已训练好的mdl、fst等文件，不包含dnn训练结果
kaldi详细资料_kadi语音识别工具_
2021-09-29 15:24

语音识别工具kaldi及其应用，kaidi全部资料，适合新手使用
kaldi-master.zip_kaldi_kaldi 源码_声纹识别_音频_音频识别
2022-07-15 13:36

kaldi 源码，音频识别，声纹识别等的相关工具源码
kaldi中文资料_v0.4和thch30学习笔记.zip
2019-09-16 16:37

语音识别工具kaldi学习资料：kaldi官网中文学习资料翻译第四版+thch30数据学习笔记
chinese-doc-of-kaldi.rar_chinese_doc_kaldi_pdf
2022-09-20 10:22

Chinese document of kaldi
基于Kaldi+GStreamer搭建线上的实时语音识别器
2021-01-06 17:57

一、安装python2.7和Tornado 4，ws4py, YAML,JSON等依赖包 1、sudo pip2 install tornado==4.3（4.0版本不行） 2、sudo pip2 install ws4py==0.3.2 3、sudo pip2 install pyyaml 4、sudo pip2 install ...
CSLU_KALDI:使用 kaldi 进行语音识别-开源
2021-05-29 04:22

将 KALDI 语音识别调整为新的语料库。
kaldi在java中运行_Kaldi语音识别CVTE模型实战
2021-03-08 00:29

weixin_39876514的博客上传到kaldi/egs/目录下 2.解压，tar -zxvf0002_cvte_chain_model_v2.tar.gz 备注：因HCLG.fst模型解压后文件较大，在解压过程中会出现停顿，等待片刻即可！ 3.将egs/wsj/s5中的steps和utils拷贝到egs/cvte/s5目录下...
ASR_Kaldi_DNN_Chinese_data.zip
2019-07-31 19:36

ASR_Kaldi_DNN_Chinese的数据文件及模型训练代码，包括音频数据、声学数据、语言数据、生成语言模型的代码、DNN训练代码。
kaldi 手把手教学，快速的进行语音识别入门开发
2022-10-29 14:34

快速的进行语音识别入门开发
kaldi的全部资料_v0.7(未完成版本).pdf
2019-12-17 23:25

kaldi是一个开源的语音识别工具箱，是基于c++编写的，可以在windows和unix平台上编译。 1)与文本无关的LVCSR系统； 2)基于FST的训练和解码； 3)最大似然训练； 4)各种各样的线性和映射变换； 5)有VTLN，SAT的...
Kaldi语音识别：aidatatang_asr开源模型实现中文语音识别详细及遇到的问题【亲自跑通】
2021-11-09 22:11

Keep828的博客本次项目是基于Kaldi做的中文语音识别，Kaldi是当前最流行的开源语音识别工具。它自带了很多特征提取模块，能提取MFCC/ivector/xvector等语音特征；也自带了很多语音模型代码，可以直接使用或重新训练GMM-HMM等模型...
kaldi-master.zip_GMM-HMM_HMM GMM_Kaldi-master-_balanceecd_yeth82
2022-09-24 10:40

Kaldi是一个非常强大的语音识别工具库，主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家修改了标签 4月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月2日

悬赏问题

¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥15 stable diffusion
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

kaldi中test_microphone对录制语音进行预处理

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新