首页 > Ai资讯 > Ai知识库 > TTS,一个奇妙的AI工具

TTS,一个奇妙的AI工具

发布时间:2024年06月06日

0. 简介

TTS是一个将文本变换成语音的AI工具。自媒体盛行的今天,很多人尝试制作视频发到自媒体平台上,通过获得流量的方式实现直接或间接变现。有部分人天生能说会道,全靠一张嘴,能完成整个视频。但大多数人,很难一次性的流畅表达一个主题,往往需要在制作视频时加入配音。
当我们制作视频的时候,就会发现,给视频配音真是一件非常专业的事,对于非专业人士,费工费力后,完成的配音效果往往并不理想。
TTS
就解决了这个问题,可以直接将写好的文案或台本转为语音播报。网络上有很多文字转语音网站都采用了这个TTS开源工具。这个AI工具支持13种语言,包括汉语。
English, Spanish, French, German, Italian,
Portuguese, Polish, Turkish, Russian, Dutch, Czech, Arabic, and Chinese
(Simplified).

1. 安装TTS的安装非常简单,还是pip安装法,在命令行终端中输入以下内容:

·

pip install TTS

不过,这次安装并不是非常顺利,遇到了问题,原因是我的Win10中没有VC++。可以按提示去安装VC++,注意要安装C++开发运行环境。

IMG_256

安装完成后,再次运行pip install TTS

IMG_257

这个AI工具的依赖库非常多,且都指定了版本。如果你电脑中有类似的AI项目在运行,强烈建议以虚拟环境的方式进行安装。可参考文章《virtualenv,一个神奇的python工具》

2. 模型和TTS运行TTS安装完成后需要下载模型才可以工作,下面链接给出的是中文模型的地址。中文转语音模型下载完成后安装在C:\Users\**\AppData\Local\tts目录下。这时就可以运行这个TTS了。TTS给出了两种运行方式,命令行和Python接口。命令行运行如下:

1 tts --text "你好" --model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" --out_path 1.wav

python代码运行如下:

1 from TTS.api import TTS
2tts=TTS("tts_models/zh-CN/baker/tacotron2-DDC-GST")
3 tts.tts_to_file(text="你好", file_path="1.wav")

3. 模型性能和训练TTS项目中给出了TTS三个模型和主流模型的评价对比图,从图中可以看到,TTS模型整体表现中等偏下。主要原因是TTS提供的是一个开源框架,公开的模型性能与商业化模型之间存在差距。如果想到得到更好的模型,可以自己进行进一步模型训练。

出自:https://mp.weixin.qq.com/s/QEYGHfeWCj3oCMTpyprMgg