首页 > Ai资讯 > Ai日报 > Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

发布时间:2024年11月06日

Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hertz-dev 是一个全双工仅支持音频的 Transformer 基础模型。

它的主要功能是用于生成对话音频,也就是模拟人类对话的语音生成。支持全双工音频,它可以同时接收和生成音频,就像电话或实时对话一样,不需要等待说完一句话才能回复。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。