开源模型竟超GPT-4?GLM-5三大黑科技引爆AI圈信任危机
刚刚,智谱发布了GLM-5技术报告,a16z直接盖章认证, 最好的开源模型,这定调够厉害的,但更厉害的是数据在稀疏注意力、异步AgentRL训练框架、自研SlimeRL基础设施三大核心技术上,GLM-5直接比开源赛道领先了很多(详细对比请看图片)
稀疏注意力,从大力出奇迹到’精准打击
Dsa稀疏注意力技术, 说的是模型处理长文本时的效率和精度,GLM-5拿到了92.3分,而之前的版本只有85.1分。
这就意味着,处理百页级文档或者长代码库的时候,模型不会再出现读了后面忘前面的情况,能精准找到关键信息, 以前用开源模型做法律合同分析,上下文一增多就发懵,现在GLM-5能稳定抓住细节,这直接就赶上闭源大佬。
异步AgentRL训练,自己搞出花样
自己研发的异步AgentRL训练框架,讲的是模型自主规划和工具调用的协同能力,GLM-5在Agent能力这一项得到了91.8分,远远超过之前的版本82.6分, 还超过了GPT-4的88。
在复杂任务场景当中,这就意味着模型可以自己拆解目标、调用工具、同时去执行,不需要人工一步步地去投喂指令,举个例子,让它调研竞品并生成报告, 它自己就能搜索、整理、分析、出稿,开源模型总算是可以自己折腾了
SlimeRL基础设施,训练效率翻倍
自己研发的SlimeRL基础设施,测试的是强化学习的训练效率和稳定性,虽说没有直接公布分数,但是技术报告显示训练成本降低了40%, 迭代速度提升了2倍。
这就意味着开发者可以用更低的成本去调整模型,小团队也能够玩得起大模型了, 智谱这是又把白嫖的门槛往下降了降。
产品这边同时放出两个实用的东西,其一,能支持Agent团队一起合作,多个Agent可同时处理复杂的工作流程,其二, 把长上下文窗口扩展到了128K,能支持把整本技术手册输进去。
关于定价和可用性方面
API的定价还是老样子, 从当下起就在智谱开放平台上线,个人开发者还是可以免费用基础额度,企业级的服务则可根据需求来扩大容量。#GLM-5# #ai智谱# #智谱智能体#
刚刚,智谱发布了GLM-5技术报告,a16z直接盖章认证, 最好的开源模型,这定调够厉害的,但更厉害的是数据在稀疏注意力、异步AgentRL训练框架、自研SlimeRL基础设施三大核心技术上,GLM-5直接比开源赛道领先了很多(详细对比请看图片)
稀疏注意力,从大力出奇迹到’精准打击
Dsa稀疏注意力技术, 说的是模型处理长文本时的效率和精度,GLM-5拿到了92.3分,而之前的版本只有85.1分。
这就意味着,处理百页级文档或者长代码库的时候,模型不会再出现读了后面忘前面的情况,能精准找到关键信息, 以前用开源模型做法律合同分析,上下文一增多就发懵,现在GLM-5能稳定抓住细节,这直接就赶上闭源大佬。
异步AgentRL训练,自己搞出花样
自己研发的异步AgentRL训练框架,讲的是模型自主规划和工具调用的协同能力,GLM-5在Agent能力这一项得到了91.8分,远远超过之前的版本82.6分, 还超过了GPT-4的88。
在复杂任务场景当中,这就意味着模型可以自己拆解目标、调用工具、同时去执行,不需要人工一步步地去投喂指令,举个例子,让它调研竞品并生成报告, 它自己就能搜索、整理、分析、出稿,开源模型总算是可以自己折腾了
SlimeRL基础设施,训练效率翻倍
自己研发的SlimeRL基础设施,测试的是强化学习的训练效率和稳定性,虽说没有直接公布分数,但是技术报告显示训练成本降低了40%, 迭代速度提升了2倍。
这就意味着开发者可以用更低的成本去调整模型,小团队也能够玩得起大模型了, 智谱这是又把白嫖的门槛往下降了降。
产品这边同时放出两个实用的东西,其一,能支持Agent团队一起合作,多个Agent可同时处理复杂的工作流程,其二, 把长上下文窗口扩展到了128K,能支持把整本技术手册输进去。
关于定价和可用性方面
API的定价还是老样子, 从当下起就在智谱开放平台上线,个人开发者还是可以免费用基础额度,企业级的服务则可根据需求来扩大容量。#GLM-5# #ai智谱# #智谱智能体#
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/211076.html