JM-0808 2023-07-27 15:14 采纳率: 0%
浏览 94

清华大学Difftalk复现问题

有人成功复现清华大学的这篇paper吗:DiffTalk: Crafting Diffusion Models for Generalized Talking Head Synthesis
作者给了完整的训练代码,但是没有给任何数据的预处理程序,我按照作者论文中的要求进行音频和图片特征的预处理,但是训练出来的结果嘴部是一直抖动的,然后我怀疑是音频特征的问题,又去作者的主页找到了另一篇预处理程序一致的论文,参考它进行音频特征的提取,但是结果依旧不好,有成功复现的朋友们可以交流交流吗

  • 写回答

3条回答 默认 最新

  • IT工程师_二师兄 2023-07-27 15:22
    关注

    你把文件发给我给你处理一下

    评论

报告相同问题?

问题事件

  • 创建了问题 7月27日

悬赏问题

  • ¥15 Opencv(C++)异常
  • ¥15 VScode上配置C语言环境
  • ¥15 汇编语言没有主程序吗?
  • ¥15 这个函数为什么会爆内存
  • ¥15 无法装系统,grub成了顽固拦路虎
  • ¥15 springboot aop 应用启动异常
  • ¥15 matlab有关债券凸性久期的代码
  • ¥15 lvgl v8.2定时器提前到来
  • ¥15 qtcp 发送数据时偶尔会遇到发送数据失败?用的MSVC编译器(标签-qt|关键词-tcp)
  • ¥15 cam_lidar_calibration报错