OpenA分享了关于Voice Engine的初步见解和结果,这是一个可以根据文本输入和一个15秒的音频样本生成接近原始说话者声音的自然听起来的语音的模型。通过这个小规模的预览,OpenAI表明即便是一个小型模型和一个15秒的样本也能创造出具有情感和真实感的声音。
主要功能
-
自然听起来的语音生成:利用单个15秒的音频样本,Voice Engine能够创造出既情感丰富又真实的语音,显著提升合成语音的自然度和真实感。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
3090显卡生成图像,支持服务器集群,确保快速生产质量