首页 > Ai资讯 > Ai日报 > ReSyncer：一个多功能统一模型可以实现音视频口型同步、说话风格迁移和换脸

ReSyncer：一个多功能统一模型可以实现音视频口型同步、说话风格迁移和换脸

发布时间：2024年08月11日

43546

ReSyncer是由清华大学、百度和南洋理工大学 S-Lab 实验室共同开发的一种新型框架，它能够生成非常逼真、与音频同步的口型视频，并且具备多种功能，如个性化调整、根据视频驱动的口型同步、改变说话风格以及进行人脸交换。

高保真度的音频同步口型视频：ReSyncer可以制作出非常逼真、准确地跟随音频同步的嘴部动作视频。
个性化微调：允许用户对生成的内容进行个性化调整，以满足不同的需求。
视频驱动的口型同步：除了音频，它还可以根据其他视频的嘴部动作来驱动同步，让新视频中的角色模仿已有视频中的说话动作。
说话风格迁移：ReSyncer可以将一个人的说话风格（如语气、节奏）迁移到另一个人身上。
人脸交换：它还可以在视频中替换说话者的面部，同时保持口型与音频的同步。

视频播放器

00:00

00:00

00:00

使用上/下箭头键来增高或降低音量。

Related Posts

Google 开发出一个能够达到人类业余水平的乒乓球机器人

Google 开发出一个能够达到人类业余水平的乒乓球机器人

2024年8月10日

苹果发布一种新的图像和视频生成方法：“套娃扩散模型” 可同时处理不同分辨率的图像

苹果发布一种新的图像和视频生成方法：“套娃扩散模型” 可同时处理不同分辨率的图像

2024年8月9日

Qwen推出专门的数学语言模型：Qwen2-Math 超越GPT-4o、Claude-3.5

XiaoHu.AI日报

Qwen推出专门的数学语言模型：Qwen2-Math 超越GPT-4o、Claude-3.5

2024年8月9日

LSLM：一种新的语音模型可以在和边你说话的同时继续倾听你说话实时回复你

LSLM：一种新的语音模型可以在和边你说话的同时继续倾听你说话实时回复你

2024年8月8日

教程：使用Runway Gen-3 将真人视频与AI生成的视觉特效相结合

教程：使用Runway Gen-3 将真人视频与AI生成的视觉特效相结合

2024年8月8日

Deep-Live-Cam：实时换脸和一键视频深度伪造工具只需单张图像即可实现人脸替换

Deep-Live-Cam：实时换脸和一键视频深度伪造工具只需单张图像即可实现人脸替换

2024年8月7日

如果你想要了解关于智能工具类的内容，可以查看智汇宝库，这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息，了解智能工具的用法以及最新动态。

Qwen推出专门的数学语言模型：Qwen2-Math 超越GPT-4o、Claude-3.5 电脑驱动下载、更新，管理软件推荐！完全免费、开源、安全

最新工具