Emilia 是一个广泛的开源多语言数据集,用于语音生成,包含六种语言的高质量语音数据。这些数据来自各种视频平台和播客,涵盖了脱口秀、访谈、辩论、体育解说和有声书等多种内容类型,确保数据集捕捉到各种真实的人类说话风格。
- 多语言数据: 数据集包括六种语言的语音数据。
- 高质量: 音频录音为高质量的 .mp3 文件,并附有相应的文本转录。
- 大规模: 数据集包含超过 101,000 小时的语音数据。
- 开源预处理: 用户可以使用 Emilia-Pipe 预处理管道来处理原始音频数据并重建数据集,或者预处理自己的语音数据。
覆盖语言:
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
AIprm是一个提示管理工具和基于社区驱动的生成式AI提示库。它为ChatGPT、Bard、Midjourney和DALL-E 2提供即用型的提示,使用户能够高效完成营销、销售、运营、生产力和客户支持任务。