字节跳动发布全双工语音大模型Seeduplex,豆包率先接入:打电话可边听边讲

字节跳动发布全双工语音大模型Seeduplex,豆包率先接入:打电话可边听边讲快科技 4 月 9 日消息 字节跳动正式推出原生 大模型 基于 边听边说 的全新架构 彻底打破传统 AI 语音交互 一问一答 的局限 实现自然实时对话 目前 Seeduplex 已在豆包 App 全量落地 成为行业内首个规模化应用的全双工语音大模型 Seeduplex 的核心突破的是改变了传统半双工 听完再说 的交互模式 真正实现了听与说的同步处理 其中两大核心能力得到重点突破

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



快科技4月9日消息,字节跳动正式推出原生大模型,基于“边听边说”的全新架构,彻底打破传统AI语音交互“一问一答”的局限,实现自然实时对话。

目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。

图片

Seeduplex的核心突破的是改变了传统半双工“听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破:

模型具备持续的“倾听”能力,从而能更好地理解用户所处的声学环境,准确忽略背景噪音和无关对话。在复杂场景下,相比半双工模型,其误回复率和误打断率减少了一半。

模型能联合语音和语义特征,综合判断用户意图,可实现更自然的对话节奏控制。面对用户的思考犹豫,模型能耐心倾听;在用户说完后,又能快速响应。相比半双工模型,其抢话比例相对下降了40%。

图片

多维度评测显示,Seeduplex在对话的流畅度和节奏感上,均显著优于传统的半双工方案及行业主流App的语音通话功能;在判停表现上,模型相比半双工方案提升了8%,展现出更接近自然对话的分寸感。

对话流畅度MOS分提升12%,整体通话满意度提升8.34%,其打断响应表现已略优于真人对话平均水平,让人机交互更贴近自然交流状态。

图片

图片

工程落地方面,该模型依托字节跳动自研LLM底座,通过架构创新、海量语音预训练、推理优化及稳定性保障,有效解决了高并发场景下的卡顿问题,可支持亿级用户稳定使用。

目前,用户更新至豆包App最新版,在“打电话”语音通话界面即可体验该功能。

小讯
上一篇 2026-04-10 07:27
下一篇 2026-04-10 07:25

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254495.html