首页 > Ai资讯 > Ai日报 > ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

发布时间:2024年10月24日

ElevenLabs 推出全新的AI语音生成工具:Voice Design ,用户可以通过描述文本提示创建个性化的语音。这项工具允许用户调整语音的多种特征,包括年龄、口音、性别、语调、音高等,以生成逼真且具有情感的AI语音。

核心功能
  • 自定义语音生成:用户可以根据文本提示快速生成自定义语音。用户可以描述语音的详细特征,如年龄(年轻、年长)、性别(男性、女性、中性)、口音(美国、英国、其他语言的口音)以及语调(严肃、友好、兴奋等)。
  • 支持角色化语音:Voice Design 还支持生成具有特定角色特征的语音,例如神话角色(如精灵、食人魔)或科幻角色(如外星人、机器人)的语音,使得生成的声音不仅限于人类特征。
  • 高灵活性和无限可能性:用户可以反复试验不同的文本提示和参数,以生成多种风格的语音,从而满足各种创意需求。
一些案例:

Voice Prompt: “A large yeti with a deep rumbling voice”
语音提示:“一只巨大的雪人,声音低沉,隆隆作响”

Voice Prompt: “A scary witch with a hushed voice”
语音提示:“声音低沉的可怕女巫”

Voice Prompt: “Old British male with a raspy, deep voice. Professional, relaxed and assertive”
语音提示:“英国年长男性,声音沙哑低沉。专业、轻松、自信”

应用场景
  • 广告与视频配音:通过生成高质量的个性化语音,用于广告、营销视频和品牌推广活动的配音,提高广告的吸引力和个性化效果。
  • 游戏与角色配音:为游戏角色生成独特的声音,使得角色更具个性化和真实感,提升玩家的沉浸感。
  • 有声书与播客:为有声书、播客或其他音频内容生成不同的角色声音,满足多角色对话或叙述的需求,使音频作品更加生动。
  • AI 助手与语音交互:用于开发具有特定语音特征的AI助手或语音交互系统,提供个性化的用户体验。
操作与使用指南
  • 文本提示输入:用户可以通过简单的文本描述(例如,“年轻的英国女性,友好而热情”)来指定语音特征,Voice Design 将根据提示生成相应的语音。
  • 语音调整功能:可以对生成的语音进行调整和优化,包括语调、音高和情感的微调,以确保语音符合具体的需求和风格。
  • 提示指南与示例:ElevenLabs 提供详细的提示指南,帮助用户理解如何编写有效的提示词来生成目标语音。同时,该工具还提供多个示例,让用户快速上手。
与其他产品的整合
  • 文本转语音:Voice Design 集成在 ElevenLabs 的文本转语音(TTS)平台中,用户可以利用这一功能将任意文本转换成生成的个性化语音。
  • 语音克隆与复制:除了创建全新的语音外,ElevenLabs 还提供语音克隆功能,用户可以录制自己的声音并进行克隆,用于视频配音、播客、广告和其他多种场景。
未来功能与API支持
  • API 接口:ElevenLabs 计划推出 Voice Design API,允许开发者将语音设计功能集成到他们的应用和平台中,提供大规模的个性化语音生成服务。
  • 实时语音生成:未来计划支持实时语音生成,进一步提升用户体验,适合对实时性有高要求的应用场景,如AI助手和实时交互。

Voice Design 使用指南

  • 路径:进入 Voices → My Voices → Add a new voice → Voice Design。
  • 生成过程:每次生成时会产生三个语音选项,用户可以选择并保存一个选项。
  • 预览费用:语音生成仅根据预览文本字符数收费,无论生成多少个语音样本,只会扣除一次字符数。

Voice Design 类型

  • 真实语音设计:生成原创、逼真的语音,可以指定年龄、口音、性别、语调、音高、语速和情感。
    • 示例:
      • “一个年轻的印度女性,声音柔和,高音,语速慢而平静。”
      • “一个年老的英国男性,声音沙哑,低沉,语气职业且放松。”
  • 角色语音设计:用于生成创意角色的独特语音,提示可以简单直接。
    • 示例:
      • “一个巨大的邪恶食人魔”
      • “一个爱唠叨的尖声老鼠”
      • “一个愤怒的老海盗,大声喊叫”

语音属性

  • 关键属性
    • 年龄:年轻、青少年、成年、中年、老年等。
    • 口音/国籍:英国、印度、波兰、美国等。
    • 性别:男性、女性、中性。
  • 可选属性
    • 语调:粗犷、柔和、温暖、沙哑等。
    • 音高:深沉、低音、高音、尖声等。
    • 语速:快速、慢速、放松等。
    • 情感/语气:愤怒、平静、害怕、开心、自信、低声、喊叫等。

官网:https://elevenlabs.io/voice-design

使用指南:https://elevenlabs.io/docs/voices/voice-lab/voice-design

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。