就在你睡觉的时候,一个中国AI又干了一件大事。
你知道吗?
就在昨天深夜,当大多数人已经刷完手机准备睡觉的时候——
月之暗面正式发布并开源了 Kimi K2.6。
没有提前大规模预热,没有请明星站台。
只是安静地,把一个可以连续不间断工作13小时、不比GPT-5.4差的模型,直接开源给了全世界。
这一次,他们又让人沉默了。
官方放出了一个实测案例。
他们让 K2.6 去做一件事:在 Mac 本地部署一个开源模型,然后用 Zig(一门极其小众的编程语言)写推理代码,并把性能优化到极致。
结果呢?
K2.6 自己摸索、自己报错、自己修复、自己迭代——
经过 4000多次工具调用,超过12小时不间断运行,14轮迭代——
把推理吞吐量从 15 tokens/秒 提升到了 193 tokens/秒。
最终性能比 LM Studio 还快了20%。
没有人工干预,没有人在旁边盯着。就这么一个人干完了。
这不是”AI助手”,这是一个能独立上班的AI员工。
K2.5 的 Agent 集群能调动 100 个子Agent,并行处理1500个步骤。
K2.6 直接翻了三倍——
300个子Agent,4000个协作步骤同时跑。
什么概念?面对全球100个半导体标的,它可以自主设计5套量化策略,同时输出建模表格和整套汇报PPT——一套操作,人类团队可能要干几周。
K2.6 在 Kimi 内部代码基准测试里,比上一代 K2.5 提升了整整 20%。
放到全球横向对比:
K2.6 在这个最能衡量真实代码能力的基准上,超过了GPT-5.4,领先Claude Opus 4.6整整5分。
而且这是开源模型。
在 OpenClaw、Hermes Agent 等自主Agent框架中——
K2.6 可以持续自主运行长达5天。
不是5小时。是5天。
这是K2.6一个容易被忽视的升级:原生多模态。
不是”后来加上去”的视觉模块,而是从架构底层就与视觉深度融合。
实测里,有人让它看一眼某个网站的截图,然后”复刻”这个页面——
K2.6 自己调用图像生成工具,自己配色、自己写动效、自己搭后端表单。
交出来的是一个有设计感、可以直接上线的专业级Web应用。
用Kimi Design Bench评测,同样的任务,47.5%的评审认为K2.6效果更好,只有31.4%更喜欢Gemini 3.1 Pro。
这次K2.6发布的同时,月之暗面预告了一个叫 “Claw群组” 的新功能——
目标是:让人类和多个AI Agent,真正坐在同一个办公群组里协作。
不管Agent跑在你的笔记本、手机,还是云端服务器——
都能进同一个群,每个Agent带着自己的技能、工具和记忆,协同完成任务。
K2.6 作为”群组协调者”,实时监控所有Agent状态,谁卡住了、谁摸鱼了,自动重新分配。
这已经不是”用AI工具”的逻辑了——
这是在组一支AI团队。
回头看看月之暗面过去9个月的时间线:
- 2025年7月:K2 开源,全球开源榜登顶
- 2025年11月:K2 Thinking 发布,学会”边思考边用工具”
- 2026年1月:K2.5 发布,Agent集群 + 多模态,席卷全球
- 2026年4月:K2.6,代码全球第一,开源
平均每2到3个月,一次重大升级。
同期,那些收费的闭源模型们,每次发布都要搞个发布会,讲三个小时PPT。
月之暗面不一样。他们的风格是:做完了,开源,给你用。
有人说,AI已经”卷”得没有意义了。
但K2.6告诉我们,真正的”卷”,是把一个AI训练到可以独自工作5天、处理真实复杂工程问题的程度,然后把这个模型免费开源给全世界。
马斯克夸过他们,Cursor偷偷用过他们,现在又是全球代码榜第一。
月之暗面,还在往前跑。
而这一次,K3 已经在路上了。
觉得有价值,转发给你身边关注AI的朋友。
关注我,第一时间追踪全球AI最新动态。
本文由mdnice多平台发布
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/279717.html