据界面新闻消息,4月9日,字节跳动宣布推出原生大模型。
据介绍,相比于上一代半双工豆包端到端语音模型,Seeduplex基于“边听边说”的全新框架设计,打破了传统语音交互“回合制问答”的限制,可同时完成实时倾听用户指令、生成回应内容、判断对话节奏三项任务,交互体验的自然感、顺畅度大幅提升。目前,该模型已在豆包App全量上线,可直接面向用户提供服务。
据新智元实测显示,在咖啡厅等嘈杂场景中,Seeduplex能主动解析声学环境,精准区分用户对话与背景噪音,误回复率和误打断率较减少一半。在用户思考停顿或临时中断对话时,模型可结合语音特征与语义特征综合判断用户状态,抢话比例下降40%,判停延迟降低约250毫秒,让语音交互更贴近真人对话节奏。
该模型还在多轮对话中保持稳定的上下文记忆能力,在飞花令、面试模拟等场景中可实现快速响应,无需用户完整说完即可生成回应,整体对话流畅度提升12%。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254060.html