首页 > Ai资讯 > Ai日报 > Parler-TTS :一个完全开源的的高质量TTS模型

Parler-TTS :一个完全开源的的高质量TTS模型

发布时间:2024年05月18日

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。

与其他TTS模型不同,Parler-TTS 完全开源发布,包括数据集、预处理、训练代码和权重。

  • 高质量、自然 sounding 的语音输出:Parler-TTS 能够生成高质量且听起来非常自然的语音。它可以根据给定说话者的风格(如性别、音调、说话风格等)进行定制,以产生与特定人声非常相似的输出。
  • 灵活的使用和部署:提供了易于使用的安装和部署方法,只需一行代码即可安装。此外,它还提供了交互式演示和详细的训练指南,使用户能够快速上手并自定义模型。
  • Datasets数据集Parler-TTS 提供了开源的注释语音数据集,范围从1,000小时到即将到达的50,000小时。这为训练和改进TTS模型提供了丰富的资源。

GitHub:https://github.com/huggingface/parler-tts

模型下载:https://huggingface.co/parler-tts

在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。