Anthropic在2026年4月16日深夜悄悄推出了Claude Opus 4.7,这个新版本最让人惊喜的就是编程能力来了个大飞跃。在SWE - benchPro基准测试里,它的得分一下子从4.6版本的53.4%冲到了64.3%,把GPT - 5.4的57.7%甩在了身后。而且SWE - benchVerified成绩也涨到了87.6%,比之前提高了差不多7个百分点。像Stripe这样的企业都说,这模型现在能自己搞定那些高难度的编程任务,还有自我纠错和验证的本事,能让人工监督省不少事。
不光编程厉害,模型的视觉能力也变强了。现在它能支持2576像素长边的图像输入,分辨率是之前的3倍还多。在CharXiv视觉推理基准测试中,得分从69.1%升到了82.1%,要是配合工具用,能达到91.0%。金融领域里,FinanceAgent v1.1测试拿了64.4%的成绩;法律方面,BigLawBench高难度任务准确率有90.9%;科研上,Graduate - level reasoning达到94.2%,多语言问答(MMMLU)也提升到91.5%,各个领域表现都挺亮眼。 另外,Opus 4.7对指令的遵循更严格了,文件系统记忆能力也优化了,不用老是重复输入上下文。不过它用了新版分词器,Token消耗增加了1.0~1.35倍,高算力模式下输出Token也多了,但价格没涨,还是输入$5/百万token,输出$25/百万token。现在通过网页端、App还有API(claude - opus - 4 - 7)都能用上了,Amazon Bedrock这些云平台也能找到它。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/278228.html