sphinx 调整中文声学模型失败

最近有个语音转文本的项目，网上有人推荐说使用sphinx，我比较熟悉Java语音，所以项目引入了sphinx4，后面在网上下载了cmusphinx-zh-cn-5.2（中文声学模型、语言模型和字典）加入到项目，按照官网的做法输入一段里面只有讲中文的音频，结果发现输出的文本识别率很低，经网上翻阅博客，有人说可以对中文声学模型做自适应以提高中文汉字识别率，于是我又按照官网给的https://cmusphinx.github.io/wiki/tutorialadapt/操作起来，结果到Accumulating observation counts这一步时，一直出现以下错误

 INFO: cmn.c(133): CMN: 59.71 16.07 -10.29 -0.39 -2.66 6.16 -8.25 -8.67 5.68 -9.06 -3.69 -4.92 -5.56 WARN: "mk_phone_list.c", line 178: Unable to lookup word '我们先来看右边的这个图' in the dictionary WARN: "next_utt_states.c", line 83: Unable to produce phonetic transcription for the utterance ' 我们先来看右边的这个图 ' WARN: "main.c", line 826: Skipped utterance ' 我们先来看右边的这个图 ' utt> 0 arctic_0001 398 0 0 utt 0.000x 0.986e upd 0.000x 0.834e fwd 0.000x 0.000e bwd 0.000x 0.000e gau 0.000x 0.000e rsts 0.000x 0.000e rstf 0.000x 0.000e rstu 0.000x 0.000e

因为我识别的是句子，所以我的自适应语料库里准备了20个句子，以及对应的20个音频，我刚开始以为出现上述错误是句子中含有标点，后面我按标点分割句子，每个句子都是独立的无标点，重新准备自适应语料库后再训练的时候还是同样的问题，我再想想是不是字典中（zh_cn.dic）缺少句子中的某个字或词，我打开字典（zh_cn.dic），发现20个句子中有些句子中的字和词完全可以在字典中找到，但20个句子均报出以上错误，这时我就纳闷了，请网上的大佬帮我指导指导，感谢。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
疯狂de攻城狮 2021-03-03 21:59
关注
问题已解决，是我在执行bw命令时，-dictfn 参数值给错了，我用的是原始的zh_cn.dic，实际上要用自定义的字典

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python结合CMUSphinx打造高效中文语音识别系统
2025-11-17 01:09

奥利奥Stack的博客本文详细介绍了如何使用Python结合CMUSphinx构建高效、完全离线的中文语音识别系统。内容涵盖环境搭建、模型部署、核心代码实现，并重点分享了通过定制语言模型、优化发音词典等实战技巧，针对特定场景大幅提升识别...
Sphinx4语音识别引擎实战教程
2025-06-15 04:19

xiaohu wang的博客随着人工智能的发展，语音识别技术在日常生活与工业应用中变得越来越重要。Sphinx4，作为一款开源的语音识别引擎，由卡内基梅隆大学开发，为语音识别领域提供了强大的支持。它不仅支持多种编程语言环境，还具有模块...
Python结合CMUSphinx打造中文语音识别系统：从安装到实战
2025-10-02 12:10

咖啡JSON的博客本文详细介绍了如何使用...从环境配置、模型部署到实战编码，手把手指导开发者完成从安装到运行的完整流程，并针对中文识别准确率问题提供了音频预处理、参数调整等优化技巧，帮助初学者快速入门离线语音识别技术。
CMUS狮身人面像（四）-构建语言模型
2024-04-28 00:05

悟V-SpHeNIC的博客例如，如果您从单词列表创建统计语言模型，它仍然允许解码单词组合，即使这可能不是您的意图。例如，您可能会列出“二十一”和“三十三”之类的数字，统计语言模型也会以一定的概率允许“三十一”。当您需要特定选项...
【人工智能】构建智能语音助手：使用Python实现语音识别与合成的全面指南
2025-01-11 13:03

蒙娜丽宁的博客随着人工智能技术的迅猛发展，语音助手已成为人们日常生活中不可或缺的一部分。从智能手机到智能家居设备，语音交互提供了便捷高效的人机交互方式。本文旨在全面介绍如何利用Python编程语言及其强大的库——`Speech...
中学生人工智能入门学习0基础学习AI人工智能深度学习神经网络
2023-11-20 11:02

babyai997的博客 36 2.3.1 PocketSphinx的使用.......................................................................... 36 习题.............................................................................................
语音识别模型比较Vosk-api：与其他开源方案对比
2025-09-06 01:17

咎鲲才的博客面对动辄数百MB的模型文件、复杂的配置流程和高昂的算力需求，很多开源方案让开发者望而却步。Vosk-api作为一款轻量级离线语音识别工具包，凭借50MB的模型体积、零依赖部署和20+语言支持，正在改变这一现状。本文将...
从零开始：Java语音识别开发实战指南——基于Sphinx4的开源语音转写与说话人识别技术
2026-02-22 01:37

强耿习Margot的博客作为一名Java开发者，当你需要构建语音交互系统时，是否曾为选择合适的语音识别工具而困扰？本文将带你深入探索Sphinx4——这款纯Java开源语音识别库，通过"问题-原理-实践-优化"的...在人工智能与物联网快速发展的今
探索AI原生应用中语音识别的商业潜力
2025-08-01 02:25

AI量化价值投资入门到精通的博客 AI原生应用是指从设计之初就将人工智能作为核心引擎，而非事后添加功能的应用程序。数据驱动：持续学习和适应新数据上下文感知：理解用户情境和意图自主性：能够做出决策并采取行动自然交互：支持人类自然的交互方式...
OpenClaw语音控制之抑制与回声消除：提升语音识别准确率
2026-04-01 16:51

龙侠九重天的博客不同ASR引擎（如Google、Wit.ai、CMU Sphinx）可能有10-20%的差异。从表中可以清晰看出，当信噪比降至5dB时，识别率会下降超过20个百分点；而在0dB（噪声功率与语音功率相当）的情况下，识别率甚至可能低于50%。这...
自动语音识别（ASR）技术详解
2025-03-26 18:05

你好，工程师的博客自动语音识别技术经过多年的发展，已经从早期简陋的模板匹配系统演进为今天复杂而精巧的深度学习模型。在原理层面，ASR将声音信号转为文本所涉及的每一步都凝聚了大量研究者的智慧；在应用层面，ASR正悄然改变着人机...
ESP32-S3轻量化边缘AI语音终端实战
2025-12-09 05:28

Black的博客边缘AI终端是指在靠近数据源头的嵌入式设备上实现语音采集、唤醒、上传与响应闭环的智能系统，其核心在于低功耗、实时性与云边协同架构。技术原理涵盖I²S双通道音频环回、VAD语音活动检测、Opus编解码、FreeRTOS多...
【大模型应用开发动手做AI Agent】OpenAI API的图片生成示例
2024-10-15 13:02

光子AI的博客大模型应用概述 1.1 大模型应用的发展历程大模型，指的是那些拥有数十亿甚至数千亿参数的深度学习模型，如GPT-3、BERT、Vision Transformer等。这些模型在各个领域展现出了强大的能力，从自然语言处理到计算机视觉...
清华开源GLM-TTS语音合成模型深度测评
2026-01-04 14:01

BE东欲的博客清华大学开源的GLM-TTS模型实现了零样本语音克隆与情感迁移，仅需3秒录音即可复刻音色，并准确处理多音字和中英混读。支持批量生成与精细发音控制，适合从个人创作到企业级应用的多种场景，兼具高性能与易用性。
【Python】构建智能语音助手：使用Python实现语音识别与合成的全面指南
2025-01-08 12:33

蒙娜丽宁的博客随着人工智能技术的迅猛发展，语音助手已成为人们日常生活中不可或缺的一部分。从智能手机到智能家居设备，语音交互提供了便捷高效的人机交互方式。本文旨在全面介绍如何利用Python编程语言及其强大的库——`Speech...
【机器学习】入门语音识别：从MFCC、HMM到CTC/Attention，让机器听懂你的声音
2025-04-21 09:15

吴师兄大模型的博客今天，我们将探索一个 fascinating 的领域——语音识别与处理 (Speech Recognition and ...从智能手机上的语音助手（如 Siri、小爱同学）到智能家居控制，再到会议记录自动转写，语音识别技术已深度融入我们的生活。
TensorFlow 智能移动项目：1~5
2023-04-16 21:50

绝不原创的飞龙的博客如果您对机器学习，深度学习，机器智能和人工智能（AI）的流行语有些困惑，这里有个简短的摘要：机器智能和 AI 确实是同一回事。机器学习是 AI 的一个领域，也是最受欢迎的领域; 深度学习是机器学习的一种特殊类型...
Qwen3-ASR-1.7B vs 轻量版：1.7B大模型在复杂环境下的碾压表现
2026-02-26 00:02

数据冰山的博客特别是对比那些轻量级小模型，在复杂声学环境下的表现简直是碾压级的。最棒的是，这个模型已经打包成了即用型镜像，你不需要懂深度学习，不需要配环境，一键就能在本地运行，完全不用担心隐私泄露问题。 1. 为什么...
小智AI音箱项目从零搭建
2025-10-31 17:37

竹石文化传播有限公司的博客小智AI音箱项目详解，涵盖硬件选型、嵌入式Linux移植、语音算法集成与全链路优化，实现低成本高可用的智能语音交互系统。
没有解决我的问题, 去提问

sphinx 调整中文声学模型失败

1条回答 默认 最新

1条回答默认最新