WeNetspeech数据集的采集处理脚本代码，有没有开源呢？能否用这个代码自己去采集数据？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
语音之家 2022-08-03 16:29
关注
不开源

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

WenetSpeech数据集实战：3步搞定10000+小时中文语音识别模型训练
2025-11-08 06:35

ik67890123的博客本文详细介绍了如何利用WenetSpeech数据集高效构建工业级中文语音识别模型。通过3个关键步骤：数据准备、预处理和模型训练，开发者可以快速掌握10000+小时中文语音数据的处理方法，并利用Conformer等先进架构提升ASR...
WenetSpeech：中文语音识别的终极数据宝库
2026-01-08 03:13

虞宜来的博客这个开源数据集汇集了超过10000小时的语音数据，专门为中文语音识别研究量身定制。 ## 核心功能亮点 ### 数据规模与质量并重 - **超大规模覆盖**：总时长10000+小时，满足各种规模训练需求 - **三级质量分级**：高...
语音数据集
2024-11-13 00:40

u013250861的博客工欲善其事必先利其器，做机器学习，我们需要有利器，才能完成工作，数据就是我们最重要...我们可能很难拿到成千上万小时的语音数据集，但是这里有一些免费开源的语音数据集，大家一定不要错过。文末附数据集下载地址。
音频数据集
2024-07-17 15:32

zhurui_xiaozhuzaizai的博客下载地址：...Mozilla 宣称其拥有可供使用的最大的人类语音数据集，当前数据集有包括 29 种不同的语言,其中包括汉语，从 4万多名贡献者那里收集了近 2454 小时（其中1965小时已验证）的录音语音数据。
【GitHub项目推荐--产品级开源实时语音对话系统】
2025-09-05 22:20

旅之灵夫的博客智能语音对话：实现自然、智能的交互，适用于各种对话场景和副语言信息。工具调用和多模态 RAG：通过利用工具调用和 RAG 访问现实世界的知识（包括文本和声学知识），Step-Audio 2 可以在多种场景下生成更少幻觉的...
阶跃星辰开源集语音理解与生成控制一体化模型——Step-Audio
2025-02-21 07:38

吴脑的键客的博客 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统，支持多语言对话（如中文，英文，日语），语音情感（如开心，悲伤），方言（如粤语，四川话），可控制语速及韵律风格，支持RAP和...
《WeNet语音识别实战》答疑回顾（二）
2022-07-26 22:27

语音之家的博客 WeNet的核心目标是为语音识别提供一套高性能易部署的工业级解决方案，完全聚焦于语音识别任务，同时对于常用的语音识别应用场景提出了一套效果极佳的端到端解决方案，而不去提供各类模型方案的大而全的集合。...
Looki 获蚂蚁、美团 2000 万美元融资；Plaud 升级录音胶囊 NotePin S，从硬件扩展至会议转录软件丨日报
2026-01-05 21:16

RTE开发者社区的博客 ASR 语音识别：多场景覆盖针对 ASR 模型，支持了包括 LibriSpeech、Common Voice、AISHELL-1、WenetSpeech 在内的十余个主流数据集。评测范围横跨清晰朗读（AISHELL-1）到复杂真实环境（WenetSpeech），从单一语种...
51c大模型~合集32
2025-10-26 20:03

whaosoft-143的博客如图 3 所示，VITA 的整体训练流程包括三个阶段：LLM 指令微调、多模态对齐和多模态指令微调。
51c大模型~合集183
2025-09-17 15:23

whaosoft-143的博客在并行推理的探索道路上，除了 ParaThinker...例如，向量化一切、RAG、多模态数据处理，数据平台被专家预测将从「仓库」进化为「中枢」——一个智能、动态、实时连接的系统，能持续为模型这个大脑提供真实世界的感知。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月3日

WeNetspeech数据集的采集处理脚本代码，有没有开源呢？能否用这个代码自己去采集数据？

1条回答 默认 最新

问题事件

1条回答默认最新