单Agent时代结束,AI们开始组团上班

单Agent时代结束,AI们开始组团上班p span 克雷西 发自 凹非寺 span span span p p span 量子位 公众号 QbitAI span p p style text align left p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

现在,大模型的密集更新实在是让人看得眼花缭乱,但整体看来,方向也无非那么几个——更大、更强、更快。

但是,Kimi这次的更新,走的方向不太一样。

昨晚,月之暗面发布并开源了旗下最新模型—— K2.6

这次更新有两个重点,一是 代码能力,包括硬核的软件工程能力和前端设计水准的提升,二是 多Agent协作的“Agent集群”能力升级。

先说榜单,Kimi K2.6在Artificial Analysis上取得了全球开源第一的成绩, 仅次于闭源的全球“御三家”

咱就是说,在御三家新模型轮流上线的这张梗图里,也是能有Kimi的一个位置了。

聊聊这个Agent集群的升级

K2.5时,Kimi提出了“Agent集群”这个概念,但那时候更像是一个方向:能调度不同专长的Agent互相补位,广度搜索、深度研究、文档分析、长文撰写一起上,并行处理。

到了K2.6,这件事变得真正有意思了:最多支持300个子Agent并行完成4000个协作步骤。

放在实际场景里, 你说一次需求,一次运行就能同时拿到文档、网站、PPT、表格

那必须给它一个任务实测一下,看它能不能一次运行、多格式并行交付,提示词如下:

帮我做一份“2026年国内AI编程助手”的报告,需要同时给我三份产出:

一篇完整的调研报告,包含各产品功能对比、定价策略、优劣势分析,以及你的选型建议;

一张结构化的对比表格,维度包括:支持IDE、补全能力、对话能力、联网能力、价格、适合人群;

一份可以直接拿去汇报的PPT,10页左右,有结论和建议页。

三份东西格式完全不同,看它是真的并行在跑、还是按顺序一个个出来,以及最后交付的质量够不够直接用。

首先,Agent集群进行了初步的扫描,并对问题的维度进行拆解,然后划分出了12个维度。

这12个维度,交给了12位不同的专家来负责,每个人都只调研自己的一个子问题。

每个专家的工作进度条和阶段性成果,都能实时监控。

到了正式撰稿阶段,同样有不同的人负责各自的Chapter。

最终,在数十位“专家”的接力之下,K2.6交付的报告长达55页,字数超3.5万,而且图文并茂、结构清晰、引文标注明确。

其中覆盖了八款主流产品,每款都有定位、核心能力和局限性的完整拆解,引用了来自IDC、Gartner、信通院等机构的数据,SWE-bench评分、中文理解准确率、定价对比一应俱全,最后还附了选型建议矩阵和企业Checklist。

篇幅和数据密度,已经超出单个对话窗口能合理完成的范畴。

表格整理得也很干净,七个维度、八款产品,支持IDE、补全能力、对话能力、联网能力、定价、适合人群一列不少,格式规整,可以直接拿来用。

PPT同样交出来了,10页,有目录、市场数据、竞品卡片、功能对比表、定价可视化、SWOT分析和选型建议,最后一页还附了行动建议。

结构完整,可以直接拿去汇报。

从一个AI,到一群AI

从K2开始,感觉Kimi模型的进化脉络更清晰了:

K2是万亿参数规模的基座,代表的是“把模型做大、做强”这件事。

K2 Thinking在此基础上引入了推理层,让模型开始能把一个复杂任务一步步想清楚,自己推导、自己验证。

到了K2.5/2.6,问题变了,Kimi团队开始把目光从专注于让单个模型变得更聪明,转向了 让一群模型真正分工协作,各自发挥专长,一起做成更大的事

图片由AI生成

这是一个本质的跨越。

道理很好理解,单个模型再强,也有天花板。

就像一个 优质牛马天才程序员,写代码可以很快,但如果让他一个人同时搞定产品设计、写代码、跑数据、出文档、做演示,那他大概率无法招架。

但一个组织可以。

从互联网的建立,到大模型的训练,乃至人类登月……靠的从来都不是某一个天才,而是一群各有专长的人,在一套分工体系下协同推进。

AI走到今天,也到了需要学这件事的时候了。

为了实现这个目标,最需要的就是一个好的协作框架。

所以,K2.6不只是在提升模型本身的参数,也在同步打磨它作为“协调者”的能力——

在任务里动态分配、在出错时自动修复、在整个交付链条上主动管理。

这是K2.6和K2.5最根本的差别之一。

不过,Kimi没打算停在“Agent集群”这一步。“Agent集群”解决的是AI之间怎么分工的问题,但还有一个问题没答——人和AI放在同一个群组里,能一起完成什么?

看到Kimi已经开始测试“Claw群组”了,支持把各种虾加入到一个群里,用K2.6做协调员,组织不同能力的虾一起干活……

不过我们目前还没收到测试邀请,要测试之后再给大家分享实际体验了 (Kimi你如果看到这篇文章的话要不给我们安排一个.doge)

One More Thing

这不是下个月量子位AIGC大会就要召开了吗,听说这次K2.6能写更精美的网页,也能支持简单后端了,我顺手就让Kimi帮忙写了个报名系统。

不过我测试的时候活动官宣还没来,所以暂时没输入具体的活动信息,先让它把功能跑通。

提示词是酱婶儿的:

帮我做一个「量子位读者交流会」的活动报名网站。要求:

首页有活动介绍、时间地点、嘉宾阵容;

有报名表单,收集:姓名、邮箱、公司、职位、「你最想聊的AI话题」;

支持提交报名,提交成功后显示报名成功页;

有一个设有密码的管理后台页面,可以查看所有报名信息并导出。

这个任务专门卡K2.6新增的后端和数据库能力,看它交出的到底是一个真的能跑的全栈应用,还是只是一个花瓶。

K2.6没有直接开始写代码。它先读了项目构建的技能文件,把任务拆成前端初始化、设计文档、后端架构、数据库schema等任务线,然后才开始动手。

值得一提的是设计决策。

我们提示词里没有说要什么风格,它自己判断“这是一个AI主题活动”,选了纯黑纯白为主色调、亮柠檬黄作为点睛色的“清晰未来主义”风格,还顺手调用图像生成工具做了五张黑白艺术风格的配套视觉素材。

首屏则是用Three.js做了3D交互式图片卡片集群,鼠标移动时卡片会翻转漂浮,还加了一套双层自定义光标系统。

技术栈它也自己选定了:前端React + Type + Tailwind + shadcn/ui,后端tRPC + Drizzle ORM + Hono + MySQL。

管理后台也做了密码验证,登录后可查看报名信息并导出CSV。

最终交付的成品长这样:

我们再来验证下报名功能,看看到底是真收集到了信息,还是只有静态动画。

结果,我们填写的报名表单成功出现在了后台记录当中,说明Kimi K2.6真的把这套报名系统的前后端和数据库开发跑通了。

小讯
上一篇 2026-04-22 13:59
下一篇 2026-04-22 13:57

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/278200.html