基于PaddleGAN快速让你的照片动起来


基于PaddleGAN快速让你的照片动起来
本项目基于PaddleGAN实现的FirstOrder与Wav2lip,。FirstOrder是输入一个模板视频与一张照片，就可以使照片里面的人物唱出模板视频里的歌曲，前段时间很火的 「蚂蚁呀嘿」就是用这个方法做的；还有另一个方法就是使用Wav2lip，输入照片和音频就可以直接让照片根据音频的内容动起来。

方案一：FirstOrder
1.下载PaddleGAN代码
In [ ]
# 从github上克隆PaddleGAN代码
!git clone https://gitee.com/paddlepaddle/PaddleGAN
In [ ]
# 安装所需安装包
%cd PaddleGAN/
!pip install -r requirements.txt
!pip install imageio-ffmpeg
%cd applications/
2.将驱动视频迁移至照片中
大家可以上传自己准备的视频和图片，并在下面的代码中source_image参数和driving_video参数分别换成自己的图片和视频路径，然后点击运行，就可以完成动作表情迁移，程序运行成功后，会在ouput文件夹生成名为result.mp4的视频文件，该文件即为动作迁移后的视频。

本项目中提供了原始图片和驱动视频供展示使用。具体的各参数使用说明如下

driving_video: 驱动视频，视频中人物的表情动作作为待迁移的对象
source_image: 原始图片，视频中人物的表情动作将迁移到该原始图片中的人物上
relative: 指示程序中使用视频和图片中人物关键点的相对坐标还是绝对坐标，建议使用相对坐标，若使用绝对坐标，会导致迁移后人物扭曲变形
adapt_scale: 根据关键点凸包自适应运动尺度
output：设置输出视频的存放文件夹
In [ ]
!export PYTHONPATH=$PYTHONPATH:/home/aistudio/PaddleGAN && python -u tools/first-order-demo.py  --driving_video /home/aistudio/PlanA_FirstOrder/zhiming.mp4 \
                                                                                                --source_image /home/aistudio/PlanA_FirstOrder/trumps.png \
                                                                                                --relative \
                                                                                                --adapt_scale \
                                                                                                --output /home/aistudio/PlanA_FirstOrder/output/
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/setuptools/depends.py:2: DeprecationWarning: the imp module is deprecated in favour of importlib; see the module's documentation for alternative uses
  import imp
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/fluid/layers/utils.py:26: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  def convert_to_list(value, n, name, dtype=np.int):
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/scipy/linalg/__init__.py:217: DeprecationWarning: The module numpy.dual is deprecated.  Instead of using dual, use the functions directly from numpy or scipy.
  from numpy.dual import register_func
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/scipy/special/orthogonal.py:81: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  from numpy import (exp, inf, pi, sqrt, floor, sin, cos, around, int,
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/scipy/io/matlab/mio5.py:98: DeprecationWarning: `np.bool` is a deprecated alias for the builtin `bool`. To silence this warning, use `bool` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.bool_` here.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  from .mio5_utils import VarReader5
[04/08 21:00:32] ppgan INFO: Found /home/aistudio/.cache/ppgan/vox-cpk.pdparams
W0408 21:00:32.665690  1292 device_context.cc:362] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1
W0408 21:00:32.673117  1292 device_context.cc:372] device: 0, cuDNN Version: 7.6.
100%|█████████████████████████████████████████| 345/345 [00:12<00:00, 28.21it/s]
3.为生成的视频加上音乐
In [ ]
# add audio
!pip install moviepy
In [ ]
#为生成的视频加上音乐
from moviepy.editor import *

videoclip_driving = VideoFileClip("/home/aistudio/PlanA_FirstOrder/zhiming.mp4") # 打开驱动视频
videoclip_result = VideoFileClip("/home/aistudio/PlanA_FirstOrder/output/result.mp4") # 打开PaddleGan刚刚生成的视频

audio_driving = videoclip_driving.audio # 提取驱动视频里的声音
video = videoclip_result.set_audio(audio_driving) # 将提取出来的声音加到生成视频的音轨中

video.write_videofile("/home/aistudio/PlanA_FirstOrder/output/final_result.mp4", audio_codec="aac") # 保存视频
生成的视频将放置在“PlanA_FirstOrder/output/”目录下，下载后即可查看效果~

方案二：Wav2lip
（若运行了方案一，请先点击代码执行器—>重启执行器）

1.安装必要的资源包
In [1]
%cd /home/aistudio/work

# 安装所需安装包
!mkdir sndfile
%cd sndfile
!wget http://www.mega-nerd.com/libsndfile/files/libsndfile-1.0.28.tar.gz
!tar xzvf libsndfile-1.0.28.tar.gz

%cd libsndfile-1.0.28
!./configure --prefix=/home/aistudio/build_libs CFLAGS=-fPIC --enable-shared 
!make
!make install
In [7]
%cd /home/aistudio/PaddleGAN
!pip install -r requirements.txt
%cd applications/
2.根据音频直接合成唇形动作
只需在如下命令中的face参数和audio参数分别换成自己的视频和音频路径，然后运行如下命令，就可以生成和音频同步的视频。

程序运行完成后，会在当前文件夹下生成文件名为outfile参数指定的视频文件，该文件即为和音频同步的视频文件。本项目中提供了demo展示所用到的视频和音频文件。具体的参数使用说明如下：

face: 原始视频，视频中的人物的唇形将根据音频进行唇形合成--通俗来说，想让谁说话
audio：驱动唇形合成的音频，视频中的人物将根据此音频进行唇形合成--通俗来说，想让这个人说什么
In [11]
!export PYTHONPATH=$PYTHONPATH:/home/aistudio/PaddleGAN && python tools/wav2lip.py --face /home/aistudio/PlanB_Wav2lip/MonaLisa.jpeg \
                                                                                    --audio /home/aistudio/PlanB_Wav2lip/TA.mp3 \
                                                                                    --outfile /home/aistudio/PlanB_Wav2lip/output/result.mp4
生成的视频将放置在“PlanB_Wav2lip/output/”目录下，下载后即可查看效果~

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-07-11 12:22
关注
文章：基于PaddleGAN精准唇形合成实现持枪人讲电话已关机中也许有你想要的答案，请看下吧
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

PaddleGAN快速让你的照片动起来
2024-03-30 13:31

羁旅少年的博客大家可以上传自己准备的视频和图片，并在下面的代码中source_image参数和driving_video参数分别换成自己的图片和视频路径，然后...face: 原始视频，视频中的人物的唇形将根据音频进行唇形合成--通俗来说，想让谁说话。
技术路线速通！用飞桨让京剧人物照片动起来
2024-07-18 15:39

飞桨PaddlePaddle的博客整体技术架构说明：基于飞桨框架的PaddleHub将戏剧人物与水墨画风格进行融合，接着使用PaddleGAN中的FOM模型进行视频人物的面部动作迁移融合，如下图所示。PaddleGAN不仅为大家提供各类经典的生成对抗网络的复现及...
李焕英照片动起来了？B站 up主用AI还原动态影像
2021-03-08 00:09

张巧龙的博客 B 站知名 up 主大谷也是《你好，李焕英》的影迷之一，不过他做了一点不一样的事情：尝试用一系列 AI 技术修复了李焕英年轻时的黑白照片，不仅给照片上了色、提高了分辨率，还让照片中的人物动了起来。原始黑白照片...
声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)
2023-05-18 07:22

刘悦的技术分享的博客 PaddleGAN视觉效果模型中一个子模块Wav2lip是对开源库Wav2lip的二次封装和优化，它实现了人物口型与输入的歌词语音同步，说白了就是能让静态图的唇部动起来，让人物看起来仿佛正在唱歌。除此以外，Wav2lip还可以...
基于PaddleGAN项目人脸表情动作迁移学习（四）人脸动漫化
2021-12-31 11:21

后知前觉的博客体验基于PaddleGAN的真实人脸实现动漫化，相关模型：AnimeGANv2。 AnimeGANv2原理：人脸动漫化（Photo to Cartoon）是指将真实人脸转化成动漫风格，在保持原图像ID信息和纹理细节的同时，将真实照片转换为卡通风格...
基于PaddleGAN精准唇形合成实现持枪人讲电话已关机
2021-01-30 13:12

AI小鸭学院的博客宋代著名诗人苏轼「动起来」的秘密就在上周，坐拥百万粉丝的独立艺术家大谷Spitzer老师利用深度学习技术使宋代诗人苏轼活过来，穿越千年，为屏幕前的你们亲自朗诵其著名古诗~ 点击量近百万，同时激起百万网友热议，...
用AI还原李焕英老照片动态影像
2021-03-03 14:31

视学算法的博客视学算法报道转载自：机器之心编辑：张倩「从我有记忆开始，妈妈就是中年妇女的模样，所以我会忘记，她也曾是花季少女。」春节档上映的《你好，李焕英》让不少人在影院哭得稀里哗啦，它戳中了每个人心里...
AI还原李焕英老照片动态影像，致敬每一位妈妈
2021-03-01 10:25

机器学习与AI生成创作的博客 B 站知名 up 主大谷也是《你好，李焕英》的影迷之一，不过他做了一点不一样的事情：尝试用一系列 AI 技术修复了李焕英年轻时的黑白照片，不仅给照片上了色、提高了分辨率，还让照片中的人物动了起来。原始黑白照片...
用技术致敬每一位妈妈，B站up主用AI还原李焕英老照片动态影像
2021-03-01 10:17

Wang_AI的博客「从我有记忆开始，妈妈就是中年妇女的模样，所以我会忘记，她也曾是花季少女。」春节档上映的《你好，李焕英》让不少人在影院哭得稀里哗啦，它戳中了每个人心里最柔软的部分。有人看完电影之后会给妈妈...
全网都在求的「蚂蚁呀嘿」教程--基于PaddleGAN的First order motion model实现
2021-03-06 09:44

「已注销」的博客本教程是基于PaddleGAN实现的First Order Motion model, 实现让任何人唱起「蚂蚁呀嘿」的旋律,若是大家喜欢这个教程，请到Github PaddleGAN主页点击star呀！下面就让我们一起动手实现吧！很多人学习python，不知道...
B站up主用AI还原李焕英动态影像
2021-03-03 14:08

Ch97CKd的博客「从我有记忆开始，妈妈就是中年妇女的模样，所以我会忘记，她也曾是花季少女。」春节档上映的《你好，李焕英》让不少人在影院哭得稀里哗啦，它戳中了每个人心里最柔软的部分。有人看完电影之后会给妈妈...
不用再找换脸教程了，飞桨PaddleGAN给你一键式体验
2019-08-02 12:55

QbitAl的博客允中发自凹非寺量子位编辑 | 公众号 QbitAI前几天发布的一篇文章中我们曾提到国外的AI捏脸应用FaceApp引发大量关注。它能让人一键变成老人，一键返老还童，一...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月11日

悬赏问题

¥20 python忆阻器数字识别
¥15 无法输出helloworld
¥15 高通uboot 打印ubi init err 22
¥20 PDF元数据中的XMP媒体管理属性
¥15 R语言中lasso回归报错
¥15 网站突然不能访问了，上午还好好的
¥15 有没有dl可以帮弄”我去图书馆”秒选道具和积分
¥15 semrush,SEO,内嵌网站，api
¥15 Stata:为什么reghdfe后的因变量没有被发现识别啊
¥15 振荡电路，ADS仿真

基于PaddleGAN快速让你的照片动起来

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新