3月16日,智谱推出了面向OpenClaw“龙虾”场景深度优化的基座模型。
“体验过OpenClaw的用户都有一个共同感受:模型能聊好天,但未必能干好活。”智谱相关负责人表示,由于“龙虾”任务不是简单的一问一答,通常涉及多轮理解、任务拆解、工具调用、状态衔接、时间触发和持续执行的长链路工作流,通用模型即使在对话能力上表现优秀,一旦进入复杂真实场景,仍然容易出现指令遵循偏差、工具调用不稳定、长任务中途“失速”等问题。
要从根本上解决这些难题,必须在基座模型层进行深度优化。针对这一痛点,GLM-5-Turbo从训练阶段围绕龙虾任务的核心需求进行专项优化,重点增强工具调用、指令遵循、定时与持续性任务、高吞吐长链路执行等能力。据透露,在自研的端到端智能体评测基准ZClawBench中,该模型取得国产模型第一的成绩,多家互联网大厂在龙虾场景内测中给予积极反馈。
对于频繁使用智能体的企业和个人而言,tokens已成为最大的成本瓶颈。例如一个典型的龙虾任务,完成一次跨部门的会议纪要整理与任务分发,可能涉及数十轮工具调用与上下文衔接,tokens消耗远超普通对话。包括智谱在内,国内众多模型企业、云厂商相继推出的“龙虾套餐”,用户可以根据自身业务规模灵活订阅。“养龙虾”的火热也让物美价廉的国产初创模型厂商直接受益。根据OpenClaw调用大模型的全球最新排行,月榜前三名已被多款中国大模型包揽。
“我们正在见证大模型从提效工具,走向企业劳动力的一场关键跃迁。”智谱相关负责人表示,以OpenClaw为代表的智能体正在进入组织内部,让企业拥有7乘24小时在线、随叫随到的AI员工,同时也成为个人的专属AI助理。
更多热点速报、权威资讯、深度分析尽在北京日报App
来源:北京日报客户端
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/242986.html