阿里巴巴发布了一个音频处理模型:Qwen2-Audio ,它可以通过语音聊天和音频分析两种方式与用户互动。在语音聊天模式下,用户可以与模型进行直接的语音对话;在音频分析模式下,用户可以上传音频文件进行转录分析等。
Qwen2-Audio 能够识别语音中的情感,如愤怒、快乐、悲伤等,为情感计算和用户情感体验提供支持。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
左脉・梦幻师是一款基于AI大模型的知识场景辅助生产力工具。