国产大模型数学能力超Gemini!AIME26榜单刚发布,kimi-k2.5强势拿下开放权重冠军,DeepSeek-V3.2紧随其后位列前三。整套竞赛题几乎被AI刷穿,只有第15题还能区分强弱——数学评测是不是已经失效了?
GPT-5.2(high)还是全球第一,但国产模型这次集体突围。AI数学能力已经到竞赛级了,得找更难的题来考这些家伙。
你觉得用什么题才能难住这些AI?评论区聊聊。
GPT-5.2(high)还是全球第一,但国产模型这次集体突围。AI数学能力已经到竞赛级了,得找更难的题来考这些家伙。
你觉得用什么题才能难住这些AI?评论区聊聊。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/211239.html