有人成功复现清华大学的这篇paper吗:DiffTalk: Crafting Diffusion Models for Generalized Talking Head Synthesis
作者给了完整的训练代码,但是没有给任何数据的预处理程序,我按照作者论文中的要求进行音频和图片特征的预处理,但是训练出来的结果嘴部是一直抖动的,然后我怀疑是音频特征的问题,又去作者的主页找到了另一篇预处理程序一致的论文,参考它进行音频特征的提取,但是结果依旧不好,有成功复现的朋友们可以交流交流吗
清华大学Difftalk复现问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
3条回答 默认 最新
悬赏问题
- ¥15 Opencv(C++)异常
- ¥15 VScode上配置C语言环境
- ¥15 汇编语言没有主程序吗?
- ¥15 这个函数为什么会爆内存
- ¥15 无法装系统,grub成了顽固拦路虎
- ¥15 springboot aop 应用启动异常
- ¥15 matlab有关债券凸性久期的代码
- ¥15 lvgl v8.2定时器提前到来
- ¥15 qtcp 发送数据时偶尔会遇到发送数据失败?用的MSVC编译器(标签-qt|关键词-tcp)
- ¥15 cam_lidar_calibration报错