首页 > Ai资讯 > Ai知识库 > 有感情的语音合成开源模型:ChatTTS安装使用详解

有感情的语音合成开源模型:ChatTTS安装使用详解

发布时间:2024年06月06日

ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练。

 

根据生成的语音效果来看,不比微软最近发布的晓晓差,甚至更好!

 

项目地址:https://top.aibase.com/tool/chattts

 

 

他们计划开源一个使用4万小时数据训练的基础模型,这个版本虽然网络规模较小,稳定性略差,但效果已经很好,并且生成的结果可以被开源的安全模型或resemble.ai检测出来。

ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍等,这表明它可以集成到多种应用程序和服务中,提供更加自然和流畅的交互体验。ChatTTS的使用过程相对简单,用户只需提供文本信息即可获得语音文件,这对于有语音合成需求的用户来说非常方便。

 

项目地址:https://top.aibase.com/tool/chattts

 

下面我就详细讲一下如何安装并使用ChatTTS。他可以基于CPU进行生成,所以大部分人都有机会用一下哦

1. 首先下载项目源码

使用科学上网,并且通过命令

Git clone https://top.aibase.com/tool/chattts

来下载源码

2. 安装依赖

 

进入项目目录,安装相关依赖

Pip install -r requirements.txt

3. python代码准备执行

按照官方示例代码来一个test.py

 

4. 自动下载模型

执行 python test.py

此时会自动下载模型文件。

 

5. Webui的方式运行

推荐使用webui的方式来运行,界面如下

 

首先安装chattts-webui:

Git clone https://github.com/cronrpc/ChatTTS-webui

然后安装依赖,依赖中少了一个gradio,需要单独安装

Pip install -r requirements.txt

Pip install gradio

然后运行python webui.py就可以打开界面进行使用了,使用时还可以通过[laugh][uv_break]来添加笑声和停顿。

小伙伴们赶紧行动起来吧!有任何疑问加我讨论:skillupvip