首页 > Ai资讯 > Ai日报 > Hedra:上传人物照片+任意语音 可实现人物唱歌、说话

Hedra:上传人物照片+任意语音 可实现人物唱歌、说话

发布时间:2024年06月20日

Hedra Labs 推出了 Character-1 的研究预览版。支持根据任意人物照片和语音内容生成个人会说话和唱歌的动态视频,也就是能让一张照片说话或者唱歌,同时保持唇形和表情、姿态和语音内容相匹配。

  • 可在桌面和移动设备上使用。
  • 功能包括:
    • 无限时长(30秒开放预览)。
    • 如果 H100 供应充足,每 60 秒生成 90 秒内容。
    • 支持表达性对话、歌唱和说唱角色。

主要功能和特点

  1. 上传人物照片
    • 用户可以上传任意人物的照片,Hedra的AI技术能够识别并处理这些图像。
  2. 添加语音
    • 用户可以上传任何语音文件,Hedra的系统将语音与人物照片结合,实现人物说话或唱歌的效果。
  3. 生成生动的视频
    • Hedra的核心产品之一是Character-1,这个工具可以生成具有表现力和可控人类角色的视频。通过Character-1,用户可以将静态照片和音频文件转化为生动的动画视频。Character-1 能生成视频和动态3D内容,特别注重表现丰富的人物。
  4. 易于使用
    • Hedra提供的工具界面友好,用户无需专业技能即可轻松上手。
  5. 高质量输出
    • 通过先进的AI技术,Hedra能够生成高质量、逼真的视频内容。同时保持唇形和表情、姿态和语音内容相一致。

使用方法:

访问:https://www.hedra.com/

可以直接文字转语音,目前有6个语音

输入或粘贴你的文本并选择一个预设的声音。

也可以直接上传音频

输入你的角色描述,Hedra 会生成角色。

满意后按“生成”。

一些案例:

部分案例来自:Heather Cooper

角色保持高度一致性。

模型能够生成会唱歌、演戏和表现不同情绪的角色。

来自 Midjourney 图像

Midjourney 图像+ ElevenLabs 的声音

Hedra 生成的图像+ ElevenLabs声音

模型不仅限于人类角色 – 它还可以生成表现丰富的无生命物体。

如果有明显的嘴巴、鼻子和眼睛效果最好。虽然不是完美,但我对这个结果感到惊喜。

 

更多案例

表情、姿态很自然

动态视频

对话视频

唱歌视频

特殊图像

更多类型

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。