关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
语音之家
2022-08-03 16:04
采纳率: 20%
浏览 18
首页
人工智能
已结题
WeNetspeech数据集的采集处理脚本代码,有没有开源呢?能否用这个代码自己去采集数据?
语音识别
人工智能
自然语言处理
WeNetspeech数据集的采集处理脚本代码,有没有开源呢?能否用这个代码自己去采集数据?
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
1
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
语音之家
2022-08-03 16:29
关注
不开源
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(0条)
向“C知道”追问
报告相同问题?
提交
关注问题
语音
数据集
2024-11-13 00:40
u013250861的博客
工欲善其事必先利其器,做机器学习,我们需要有利器,才能完成工作,
数据
就是我们最重要...我们可能很难拿到成千上万小时的语音
数据集
,但是这里有一些免费
开源
的语音
数据集
,大家一定不要错过。文末附
数据集
下载地址。
音频
数据集
2024-07-17 15:32
zhurui_xiaozhuzaizai的博客
下载地址:...Mozilla 宣称其拥有可供使用的最大的人类语音
数据集
,当前
数据集
有包括 29 种不同的语言,其中包括汉语,从 4万多名贡献者那里收集了近 2454 小时(其中1965小时已验证)的录音语音
数据
。
阶跃星辰
开源
集语音理解与生成控制一体化模型——Step-Audio
2025-02-21 07:38
吴脑的键客的博客
Step-Audio 是业界首个集语音理解与生成控制一体化的产品级
开源
实时语音对话系统,支持多语言对话(如 中文,英文,日语),语音情感(如 开心,悲伤),方言(如 粤语,四川话),可控制语速及韵律风格,支持RAP和...
【GitHub项目推荐--产品级
开源
实时语音对话系统】
2025-09-05 22:20
旅之灵夫的博客
智能语音对话:实现自然、智能的交互,适用于各种对话场景和副语言信息。工具调用和多模态 RAG:通过利用工具调用和 RAG 访问现实世界的知识(包括文本和声学知识),Step-Audio 2 可以在多种场景下生成更少幻觉的...
《
WeNet
语音识别实战》答疑回顾(二)
2022-07-26 22:27
语音之家的博客
WeNet
的核心目标是为语音识别提供一套高性能易部署的工业级解决方案,完全聚焦于语音识别任务,同时对于常用的语音识别应用场景提出了一套效果极佳的端到端解决方案,而不去提供各类模型方案的大而全的集合。...
解锁10000+小时中文语音识别:
Wenet
Speech
完全使用指南
2025-11-20 10:59
万钧瑛Hale的博客
[
Wenet
Speech
数据集
概览](https://raw.gitcode.com/gh_mirrors/we/
Wenet
Speech
/raw/c936750d7eb40720f6117fcc08ba20ac0a180933/res/
wenet
speech
.jpg?utm_source=gitcode_repo_files)]...
51c大模型~合集32
2025-10-26 20:03
whaosoft-143的博客
如图 3 所示,VITA 的整体训练流程包括三个阶段:LLM 指令微调、多模态对齐和多模态指令微调。
51c大模型~合集183
2025-09-17 15:23
whaosoft-143的博客
在并行推理的探索道路上,除了 ParaThinker...例如,向量化一切、RAG、多模态
数据
处理
,
数据
平台被专家预测将从「仓库」进化为「中枢」——一个智能、动态、实时连接的系统,能持续为模型这个大脑提供真实世界的感知。
51c大模型~合集111
2025-02-07 11:02
whaosoft-143的博客
OpenAI 的某发言人表示:「为了提高清晰度和安全性,我们增加了一个额外的后
处理
步骤,其中模型会审查原始的思维链,删除任何不安全的内容,然后简化某些复杂的思维。可以看到,虽然 ChatGPT 确实完成了任务并展示了...
大型音频语言模型论文总结
2025-08-06 20:28
第六五签的博客
MiDashengLM 通过通用音频字幕突破传统 ASR 依赖,结合
开源
编码器 Dasheng、三阶段训练流程及创新
数据集
,实现了对语音、声音、音乐的统一理解。其核心优势在于:(1)全面捕捉音频语义与声学特征;(2)高效利用...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
8月11日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
8月3日