MockingBird- 文字转语音神器!附最新安装使用教程!
发布时间:2024年04月23日
1.安装Python 选择3.8 或更高版本 【官方链接】
2.安装 PyTorch, 直接官网下载 【官方链接】,如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。
3.安装 ffmpeg 【下载链接】,下载后把bin目录路径path到系统变量里,见视频教程。
4.下载 MockingBird 【开源项目】下载解压后,直接在目录输入CMD 进入终端
5.在终端下安装剩余的必备环境包:
python -m pip install --upgrade pip
pip install -r requirements.txt
pip install webrtcvad-wheels
6.下载语言模型,或使用自己训练好的模型
作者 | 下载链接 | 效果预览 | 信息 |
---|---|---|---|
作者 | https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d | 75k steps 用3个开源数据集混合训练 | |
作者 | https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f | 25k steps 用3个开源数据集混合训练, 切换到tag v0.0.1使用 | |
@FawenYo | https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024 | input output | 200k steps 台湾口音需切换到tag v0.0.1使用 |
@miven | https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 | 150k steps 注意:根据issue修复 并切换到tag v0.0.1使用 |
7.下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建
8.最后执行运行命令,就可以启动程序了!
启动Web程序(v2)
python web.py
运行成功后在浏览器打开地址, 默认为 http://localhost:8080
训练数据集下载【点击】
GUI启动命令:
启动工具箱:
python demo_toolbox.py -vc -d <datasets_root>
假如数据集路径为 C:\data\aidatatang_200zh
,那么 <datasets_root>
就是 C:\data
程序界面功能说明:
如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。
专业开发者社区