ChatTTS Speaker 提供了ChatTTS生成的音色的稳定性评分,并根据性别和年龄分类,用户可以试听这些音色。
ChatTTS Speaker 使用了通义实验室的 ERes2NetV2 说话人识别模型对音色进行打分。具体评分指标包括:
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
OpenAI文字生成视频模型,Sora 可以根据文字提示生成长达 60 秒的高清视频,而且视频能包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。