从录音中提取语音特征，再去做个性化语音合成

诸位语音分析处理等相关领域的高人，小民实在有事相求，现在只能广发此求助信，希望能得到些许帮助。!
2016年1月3日我们用笔记本拍的唯一一次全家福

现在我手上只有若干个语音文件（wav），我老婆生前留下来的，简单的来说，就是想要三岁的孩子，以后还能听到妈妈的声音，孩子叫妈妈，妈妈会答应一声，再奢望一点，就是孩子能和妈妈能简单的对话，让孩子感觉到妈妈还在他身边。

我有很多种空想和假设，但是实现起来，却是如此的困难，翻遍互联网，发现要做个性化语音合成，必须先对她进行声音训练，可是她人都不在了，怎么去训练呢，怎么提取她的语音特征？

我实在没有办法，只好跪求诸位高人，帮我出出招吧，求求您们了!!!

第一步计划，目标很简单：
1、从录音文件里提取语音特征，来合成其他语音，
2、用她的语音特征，来代替我的说话声音
3、语音聊天机器人，用她的语音特征发音，这是后话。

您们看看能给我提提建议吗，哪怕给我指定一个方向，我也好走啊，求助啊求助。虽然我没有什么钱，但是我绝对继续为她花钱，来报答您们的帮助。

我本人也是三岁的时候，失去母亲的，我深深知道没有妈妈的孩子，会承受上天给予多么严重的不公平，也许是宿命，但是我不想我闺女再去重复我的悲剧！绝对不能。

求求您们帮帮我，她的身体没了，我可以想尽办法，重新给她造一个，她的声音没了，只有您们能帮我，求求您们帮帮我吧。

孩子还在等着我带妈妈回家呢，我对孩子撒谎，“妈妈生病了，躺在医院不能动，不能说话，以后你要照顾她 ”，“等过年了，我们有住的地方，我就把妈妈接回来，我们一家三口又能开开心心在一起！”， “现在妈妈生病住医院，花了很多钱，爸爸要去上班挣钱，把妈妈接回来”。

如果您们有什么建议的方向或者路子，有可能的邮箱、论坛、或者博客，给我指条路也好啊。回我邮件提供帮助信息的，顺便回一个微信或者支付宝账号，我无论如何，会多多少少给予相应的报答，真的！请您不要嫌弃我的微薄的回报，我会把您铭记在心里，如果您不嫌弃，我会把今后，关于孩子妈妈的重塑计划的成果给您们反馈和分享。

最后，衷心的感谢，您在百忙之中能看我的这篇邮件

本人彭长春 tel 13391779559 QQ 420993170 很普通的一个程序员今年29岁，我妻子也是29岁，孩子3岁半，关于她妈妈出事的事情经过我已经传在百度贴吧里，http://tieba.baidu.com/p/4520527314?pid=88839687410&cid=0&from=singlemessage&isappinstalled=1&pn=0&

真诚期待您们的帮助，谢谢！

不要看C币，我一定用真是货币酬谢，因为我不怎么上着网，很少登录到这里，所以没有C币

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-05-13 14:11
关注
http://my.oschina.net/freeblues/blog/63621?p=1

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

matlab语音信号采样和抽样 matlab
2022-11-07 19:37

回答 2 已采纳是的，采样抽样一个意思，实际上手机录音后已经是采样过的数字信号了（计算机里没有连续的模拟信号，大多数媒体音频都是44100hz采样来的），然后让你把录音文件导入matlab里，再自定义一个采样频率（比
关于Android Studio使用google api语音识别的应用 android-studio 语音识别
2018-03-13 01:21

回答 2 已采纳在6.0以前的系统，都是权限一刀切的处理方式，只要用户安装，Manifest申请的权限都会被赋予，并且安装后权限也撤销不了。 Android 6.0 采用新的权限模型，只有在需要权限的时候，才告
讯飞语音识别监听的同时识别语音识别
2016-03-29 12:44

回答 1 已采纳 http://www.cnblogs.com/zhangdongdong/p/3502553.html
从录音中提取语音特征，再去做个性化语音合成
2016-05-14 22:16

weixin_33888907的博客现在我手上只有若干个语音文件（wav），我老婆生前留下来的，简单的来说，就是想要三岁的孩子，以后还能听到妈妈的声音，孩子叫妈妈，妈妈会答应一声，再奢望一点，就是孩子能和妈妈能简单的对话，让孩子...
如果将电话语音数字化并以16K Hz （大于每秒8K Hz ）对其进行采样，那么数据大小有什么区别？ java javascript 其他有问必答
2022-04-07 15:14

回答 3 已采纳传统上电话的语音采样率主要是为 8 kHz，如果采用16kHz的采样率，则采样频率提高一倍。根据奈奎斯特定理可知，采样率必须大于被测信号感兴趣最高频率分量的两倍，才能保证信号不失真。而人声的频率是：男
一般外呼场景都是8k采样率的录音，假设模型都一样，8k和16k不同采样率训练出的模型准确率会有差距吗？人工智能自然语言处理语音识别
2022-07-22 17:19

回答 2 已采纳理论上模型一样的情况下，16k采样率的数据天然比8k效果会更好，训练的模型效果也会更好。但是如果是将8k的录音上采到16k，在走同样的模型，那么就不一定会更好了。不过一般来说更大的采样率可以搭配更深的
Android录音文件和下载的音频合成 android
2016-03-11 04:49

回答 5 已采纳 ffmpeg http://blog.csdn.net/sophie_wise8/article/details/22732397 http://blog.csdn.net/wangjianz
TTS | 一文了解语音合成经典论文/最新语音合成论文篇【20240111更新版】
2023-03-08 15:36

夏天｜여름이다的博客 Text-to-speech(TTS)文本到语音，也就是语音合成。本文主要介绍一些语音合成的综述以及一系列经典论文。现有的语音合成的模型大多基于以下模型的核心思想。
H5+js 如何实现手机网页录音并上传到项目文件夹下 javascript
2017-05-05 06:38

回答 3 已采纳第一个：h5的audio大多数移动端浏览器都支持，相对来数兼容性没有pc那么费事。第二个：第三个：可以通过ajax的post发送给后台。
讯飞实时语音转写，获取的路径报错找不到上传的音频文件 java 有问必答
2021-09-13 08:42

回答 5 已采纳使用随机读取流的时候，改为可读可写模式。
请教：用何种技术手段，才能在HTML5页面上实现一边播语音，一边给所播语音对应的文字加标记的功能？ html5 javascript
2019-06-27 17:26

回答 2 已采纳你去扒它的源码可以知道，它的入口是update()方法；其中INLINE_JSON里面包含 answer threatens 和 words。 answer threatens 是整篇文章；wor
通用场景语音合成数据集推荐
2022-08-26 15:12

数据堂官方账号的博客温柔亲切的年青女性录制，六种情感文本，语料音素覆盖均衡，专业语音学家参与标注，文字标注的字准确率不低于99.9%，音素标注的句准确率不低于99%，韵律标注的句准确率不低于98%。年轻积极的成人男性录制，语料涵盖...
Cbuilder录音程序怎么写 c++
2016-12-12 07:52

回答 2 已采纳 http://blog.csdn.net/dafan/article/details/4223168
语音识别与语音合成
2024-04-20 16:12

wcywcy11的博客 {'vol': 5}) print(result) #可以做一些个性化设置，如选择音量、发音人、语速等识别并正确返回语音二进制代码,错误则返回dict（相应的错误码） if not isinstance (result, dict): with open (filePath,'wb')as f:...
使用sambert-hifigan微调实现个性化声音定制
2023-10-05 13:36

Saber_Alpha的博客本文调研了语音合成的相关开源项目。并使用sambert-hifigan进行声音模型微调，实现个性化声音定制。
打破定制化语音技术落地怪圈？从讲一口标准英音的语音助手说起
2020-08-20 11:17

AI科技大本营的博客与Siri一样，Beeb不是硬件设备，而是内置于BBC网站和iPlayer TV流媒体服务的数字化语音助手。如果你想听相关广播电台、播客或新闻，可以通过语音互动的方式进行点播，当然，你想要听笑话，它也会立马为你随机播放...
定制音库成本骤降98%，PaddleSpeech小样本语音合成方案开源了！
2022-10-17 22:00

Datawhale的博客 Datawhale开源方向：语音合成开源项目随着以语音为交互渠道的产业不断升级，企业对于语音合成也有着越来越多的需求，比如智能...面对音库成本难题，PaddleSpeech语音合成技术再升级，开源多种降低定制音库成本方案...
没有解决我的问题, 去提问

悬赏问题

¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记

从录音中提取语音特征，再去做个性化语音合成

2条回答 默认 最新

悬赏问题

2条回答默认最新