VLOGGER是一个利用文本和音频驱动的方法,可以从人的单张照片生成说话的人视频。
给定一张人的单张输入图像和一个音频样本,VLOGGER能够生成该人物讲话和生动移动的逼真且时间连贯的视频。与之前的方法不同,VLOGGER能够生成头部运动、注视、眨眼、嘴唇运动以及不同于之前方法的上身和手势动作,进一步推进了音频驱动合成的步骤。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
专注于企业微信互动营销解决方案,旗下产品积分宝 任务宝 群发宝 分销宝 通灵宝 分享宝 分销宝 拼团购 醉赞SCRM