ClaudeOpus4.7正式发布编程、金融、多模态全面升级

ClaudeOpus4.7正式发布编程、金融、多模态全面升级p cms style font L CNMO 科技消息 近日 Anthropic 正式发布 Claude Opus 4 7 距上一次 Opus 4 6 发布仅间隔两个月 延续了每两个月一次的稳定迭代节奏 p div class img wrapper div

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

  【CNMO科技消息】近日,Anthropic正式发布Claude Opus 4.7,距上一次Opus 4.6发布仅间隔两个月,延续了每两个月一次的稳定迭代节奏。

  Clude

  在软件工程领域,Opus 4.7取得了最突出的进步。在业界公认最硬核的SWE-bench Pro基准测试上,Opus 4.7从前代的53.4%跃升至64.3%,单代升级提升近11个百分点,大幅领先GPT-5.4(57.7%)和Gemini 3.1 Pro(54.2%)。在SWE-bench Verified上更是达到87.6%,CursorBench也从58%升至70%。

  Anthropic称,这是首个能自主通过“隐含需求测试”的Claude模型——模型需自行推断所需工具或行动,而非被明确告知。早期测试中,它甚至能反驳用户,拒绝盲从错误指令,早期用户评价其“感觉像一个更好的同事”。

  在多项基准测试中,Opus 4.7超越了GPT-5.4和Gemini 3.1 Pro:金融分析代理测试取得全球最高分;工具调用规模化评测MCP-Atlas达77.3%,超GPT-5.4的68.1%和Gemini的73.9%;法律AI平台Harvey的BigLaw基准上拿下90.9%;多步智能体推理提升14%,工具错误减少三分之一。

  但也并非全面领先——Agentic search评测BrowseComp从前代的83.7%降至79.3%,被GPT-5.4(89.3%)和Gemini(85.9%)反超。整体而言,在直接可比基准上Opus 4.7仅以7比4的优势领先GPT-5.4,各实验室差距正在迅速缩小。值得注意的是,Opus 4.7并非Anthropic最强模型——Claude Mythos Preview仍因安全顾虑被限制使用,Opus 4.7与其存在全方位能力差距。

  在实际应用层面,Opus 4.7可放心交付最复杂编码任务,能自行设计验证机制检查输出结果。Claude Code新增自动化Routines功能,支持定时/API/GitHub触发,合上电脑也能7×24小时运行,其年化营收已达25亿美元。

  金融分析方面,它能生成严谨分析与建模、专业报告展示,任务间整合更紧密。视觉多模态支持边长最大2576像素的图像(约3.75百万像素,是前代三倍多),可解读密集截图、复杂图表和界面布局,官方称其更有“品味”且更具创造力。此外,模型能跨会话记住关键信息并复用于新任务,减少前置上下文,并引入新护栏,自动检测并拦截高风险网络安全请求。

小讯
上一篇 2026-04-25 18:31
下一篇 2026-04-25 18:29

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/273406.html