2026年MiniMax M2.7 - MiniMax 最新发布的旗舰大语言模型,具备自我进化能力

MiniMax M2.7 - MiniMax 最新发布的旗舰大语言模型,具备自我进化能力MiniMax M2 7 是 MiniMax 最新发布的旗舰大语言模型 也是首个深度参与自身迭代过程的 MiniMax 模型 M2 7 能够自行构建复杂 Agent Harness 通过自主迭代循环优化自身表现 在三大核心方向上达到国际一线水准 软件工程 SWE Pro 得分 56 22 接近 Opus **水平 专业办公 GDPval AA ELO 得分 1500 为开源最高

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



MiniMax M2.7 是 MiniMax 最新发布的旗舰大语言模型,也是首个深度参与自身迭代过程的 MiniMax 模型。M2.7 能够自行构建复杂 Agent Harness,通过自主迭代循环优化自身表现。在三大核心方向上达到国际一线水准:软件工程 SWE-Pro 得分 56.22%,接近 Opus **水平;专业办公 GDPval-AA ELO 得分 1500,为开源最高;OpenClaw 生态适配 MM-Claw 得分 62.7%,接近 Sonnet 4.6。现已通过 MiniMax Agent 产品端与 API 开放平台全量上线,面向开发者和企业用户开放调用。

MiniMax M2.7

Q:M2.7 和上一代 M2.5 相比有哪些核心提升?

A:三个方向提升最为显著:一是 OpenClaw 生态适配,MM-Claw 评测得分从 M2.5 有显著提升,接近 Sonnet 4.6;二是专业办公,对 Word/Excel/PPT 的复杂编辑和多轮高保真修改能力大幅增强;三是新增模型自我进化能力,M2.7 是首个能深度参与自身迭代循环的 MiniMax 模型。

Q:M2.7 在 OpenClaw 里用起来效果怎么样?

A:官方基于 OpenClaw 常用任务构建了专项评测集 MM-Claw,M2.7 得分 62.7%,接近 Sonnet 4.6 水平。在 40 个复杂 Skills 测试中保持 97% 的遵循率,对长上下文、多步骤任务的稳定性表现较好。

Q:M2.7 适合用来写代码吗?

A:适合,且不只是代码生成。M2.7 在真实软件工程场景(SWE-Pro 56.22%、VIBE-Pro 55.6%)表现接近 Opus,覆盖从代码生成、Bug 排查到完整项目交付的全链路,尤其擅长生产环境故障调试和日志分析。

Q:OpenRoom 是什么?

A:OpenRoom 是 MiniMax 配套发布的互动娱乐开源框架,将 AI 互动置入可视化 Web GUI 空间,支持实时场景交互和角色主动行为,已开源在 github.com/MiniMax-AI/OpenRoom,可访问 openroom.ai 直接体验。

亮点: M2.7 最值得关注的是”模型自我进化”这一设计——让模型深度参与自身迭代循环,在内部测试中自主运行超过 100 轮后效果提升 30%,这在国内大模型中尚属首次公开披露的实践。软件工程能力接近 Opus 水平、专业办公 GDPval-AA 开源最高、OpenClaw 生态 97% Skills 遵循率,三个维度的基准数据均有具体支撑,可信度较高。对 OpenClaw 用户来说,M2.7 是目前国内模型里适配最好的选项之一。

小讯
上一篇 2026-03-19 15:23
下一篇 2026-03-19 15:21

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/245544.html