4月23日,腾讯混元发布并开源了重建后的首款大模型Hy3 preview。这也是首席AI科学家姚顺雨加入腾讯后交出的首份答卷。该模型采用295B参数的快慢思考混合专家架构,在代码和智能体能力上提升显著,成为腾讯底层重构、全力追赶大模型第一梯队的关键起点。
一、底层大重构
腾讯这次狠下心把预训练、强化学习等底层框架全推倒重来了,虽然冒着短期性能倒退的风险,但为了在AI赛道追上队伍,这阵痛必须得扛。
二、核心新能力
新模型主打全面实用不偏科,参数295B激活21B,支持256K长上下文。代码和智能体能力猛涨,虽然官方很谦虚地说成绩有竞争力,但其实测数据比以前飙升了一大截,部分指标已经能跟头部模型掰手腕了。
三、实战好不好
自家产品用起来确实香!在腾讯各种开发工具里,响应速度直接快了一半,成功率接近满分。腾讯内部程序员盲评也有一半多觉得它更好用,而且价格主打便宜实惠,不跟风去刷分榜单。
四、智能体大牛
带队的大牛姚顺雨来头不小,曾在OpenAI搞过爆款产品。他读博时发明的ReAct和思维树技术,现在都是全球做智能体的主流基础,所以这版模型在代码和智能体方向这么强也就不奇怪了。
五、全面铺开用
这只是个开头,更大的模型还在练。现在Hy3 preview已经接入了元宝、、腾讯文档等一堆腾讯明星产品,而且权重也开源了,第三方智能体也能直接接,就看大家用得爽不爽了。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/283085.html