有感情的语音合成开源模型:ChatTTS安装使用详解
发布时间:2024年06月06日
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练。
根据生成的语音效果来看,不比微软最近发布的晓晓差,甚至更好!
项目地址:https://top.aibase.com/tool/chattts
他们计划开源一个使用4万小时数据训练的基础模型,这个版本虽然网络规模较小,稳定性略差,但效果已经很好,并且生成的结果可以被开源的安全模型或resemble.ai检测出来。
ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍等,这表明它可以集成到多种应用程序和服务中,提供更加自然和流畅的交互体验。ChatTTS的使用过程相对简单,用户只需提供文本信息即可获得语音文件,这对于有语音合成需求的用户来说非常方便。
项目地址:https://top.aibase.com/tool/chattts
下面我就详细讲一下如何安装并使用ChatTTS。他可以基于CPU进行生成,所以大部分人都有机会用一下哦。
1. 首先下载项目源码
使用科学上网,并且通过命令
Git clone https://top.aibase.com/tool/chattts
来下载源码
2. 安装依赖
进入项目目录,安装相关依赖
Pip install -r requirements.txt
3. 写python代码准备执行
按照官方示例代码来一个test.py
4. 自动下载模型
执行 python test.py
此时会自动下载模型文件。
5. Webui的方式运行
推荐使用webui的方式来运行,界面如下
首先安装chattts-webui:
Git clone https://github.com/cronrpc/ChatTTS-webui
然后安装依赖,依赖中少了一个gradio,需要单独安装
Pip install -r requirements.txt
Pip install gradio
然后运行python webui.py就可以打开界面进行使用了,使用时还可以通过[laugh]和[uv_break]来添加笑声和停顿。
小伙伴们赶紧行动起来吧!有任何疑问加我讨论:skillupvip
悬河基于人工智能大模型,构造出一个个有知识、有个性、有风格的AI数字人虚拟人智能体。