2026年“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClaw

“养龙虾”爆火,首个模型排行榜出炉 MiniMax、Kimi国产双雄霸榜OpenClawp 来源 财闻 p p cms style font L 谷歌的 Gemini 3 Flash Preview 以 95 1 的成功率夺冠 p p cms style font L 当地时间 3 月 7 日 OpenClaw 创始人 Peter Steinberger p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



(来源:财闻)

谷歌的Gemini 3 Flash Preview 以95.1% 的成功率夺冠。

当地时间3月7日,OpenClaw 创始人 Peter Steinberger 在平台X上分享龙虾基准测试排行榜。PinchBench 测试了32款主流大模型,从成功率、速度、费用三个维度,测试哪个模型最适合养龙虾。

排行榜显示,谷歌(GOOGL.US)的Gemini 3 Flash Preview 以95.1% 的成功率夺冠,其次是国产模型 MiniMax M2.1,成功率93.6%,战胜 Claude Sonnet 4.5(92.7%)和 GPT-4o(85.2%)等一众国际大模型。

Kimi K2.5则以93.4%的成功率紧随其后,位居第三。至此,国产双雄直接占据了 TOP3的两个席位。

小讯
上一篇 2026-03-31 10:13
下一篇 2026-03-31 10:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/229250.html