首页 > Ai资讯 > Ai日报 > VoiceCraft:无样本文本到语音转换和语音编辑模型

VoiceCraft:无样本文本到语音转换和语音编辑模型

发布时间:2024年05月18日

VoiceCraft是由德州大学奥斯汀分校和Rembrand的研究团队开发的高级语音技术。它主要做两件事:一是编辑现有的语音录音,二是将文本转换成语音(也就是文字到语音转换,简称TTS),并且这些都可以在没有事先大量学习特定人声的情况下完成。

VoiceCraft在语音编辑方面能够使编辑后的语音几乎听不出和原始录音的区别。在无样本文本到语音转换(即在没有大量特定人声学习样本的情况下进行文字到语音的转换)方面,它的性能超过了当前最好的模型,包括VALLE和XTTS v2这样的商业模型。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Subscribe

Gain access to all our Premium contents.
More than 100+ articles.

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。