OpenA分享了关于Voice Engine的初步见解和结果,这是一个可以根据文本输入和一个15秒的音频样本生成接近原始说话者声音的自然听起来的语音的模型。通过这个小规模的预览,OpenAI表明即便是一个小型模型和一个15秒的样本也能创造出具有情感和真实感的声音。
主要功能
-
自然听起来的语音生成:利用单个15秒的音频样本,Voice Engine能够创造出既情感丰富又真实的语音,显著提升合成语音的自然度和真实感。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
一站式短视频制作,视频数据等管理工具为短视频创作者提供一站式灵感创意、视频生成、内容风控、矩阵SEO优化、数据分析、账号管理、一键式私信、回复评论等专业服务工具