现在正在参与一个在线语音势必别项目,但是在多说话人混叠场景,我们还是希望asr能识别主要说话人(先说话的),抑制其他说话人的干扰,相关内容设计语音分离或语音增强,现在要求做成在线流式的,有没有比较不错的预训练模型?case参考:https://google.github.io/speaker-id/publications/VoiceFilter/
23条回答 默认 最新
悬赏问题
- ¥15 opengl多点光源阴影贴图渲染算法问题
- ¥20 access中怎么分割分别获取一下图中的值
- ¥15 keras_tcn已经安装成功,还是显示ModuleNotFoundError: No module named 'keras_tcn'
- ¥15 类图中关联与聚合的区别
- ¥15 ENVI高分五号去除云层的方法
- ¥15 16进制数据如何得到奇偶校验位
- ¥15 求合并两个字节流VB6代码
- ¥15 Pyqt 如何正确的关掉Qthread,并且释放其中的锁?
- ¥30 网站服务器通过node.js部署了一个项目!前端访问失败
- ¥15 WPS访问权限不足怎么解决