首页 > Ai资讯 > Ai知识库 > 有感情的语音合成开源模型：ChatTTS安装使用详解

有感情的语音合成开源模型：ChatTTS安装使用详解

发布时间：2024年06月06日

ChatTTS是一个为对话场景设计的语音生成模型，专门用于大型语言模型（LLM）助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文，并且在视频中展示的是中等参数的版本，使用了约10万小时的中英文数据进行训练。

根据生成的语音效果来看，不比微软最近发布的晓晓差，甚至更好！

他们计划开源一个使用4万小时数据训练的基础模型，这个版本虽然网络规模较小，稳定性略差，但效果已经很好，并且生成的结果可以被开源的安全模型或resemble.ai检测出来。

ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍等，这表明它可以集成到多种应用程序和服务中，提供更加自然和流畅的交互体验。ChatTTS的使用过程相对简单，用户只需提供文本信息即可获得语音文件，这对于有语音合成需求的用户来说非常方便。

下面我就详细讲一下如何安装并使用ChatTTS。他可以基于CPU进行生成，所以大部分人都有机会用一下哦。

1. 首先下载项目源码

使用科学上网，并且通过命令

来下载源码

2. 安装依赖

进入项目目录，安装相关依赖

Pip install -r requirements.txt

3. 写python代码准备执行

按照官方示例代码来一个test.py

4. 自动下载模型

执行 python test.py

此时会自动下载模型文件。

5. Webui的方式运行

推荐使用webui的方式来运行，界面如下

首先安装chattts-webui:

然后安装依赖，依赖中少了一个gradio，需要单独安装

Pip install -r requirements.txt

Pip install gradio

然后运行python webui.py就可以打开界面进行使用了，使用时还可以通过[laugh]和[uv_break]来添加笑声和停顿。

小伙伴们赶紧行动起来吧！有任何疑问加我讨论:skillupvip

SD3 正式开源 Sora同源架构动作识别模型有哪些