Claude“降智”风波与反击:Opus 4.7来了,Claude Design也来了

Claude“降智”风波与反击:Opus 4.7来了,Claude Design也来了短短两个月内 Claude 经历了从 编程天花板 到 赛博油条 的口碑崩塌 又在骂声中端出了 Opus 4 7 与 Claude Design 两记重拳 这背后 究竟是算力危机 商业考量 还是战略转型 据 大模型 API 聚合平台 proaiapi tech 报道 2026 年 4 月

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



短短两个月内,Claude 经历了从“编程天花板”到“赛博油条”的口碑崩塌,又在骂声中端出了 Opus 4.7 与 Claude Design 两记重拳。这背后,究竟是算力危机、商业考量,还是战略转型?


据 大模型API聚合平台 proaiapi.tech 报道,2026年4月,AI圈掀起了一场前所未有的“信任危机”。

曾经的编程之神——Claude Opus 4.6,在短短两个月内从全球排名第2骤降至第10,被无数开发者指着鼻子骂“降智”。AMD高管用6852次真实会话日志打脸,数据触目惊心:思考深度暴跌67%,代码阅读次数从6.6次降至2.0次。

然而,就在骂声最烈的时候,Anthropic不动声色地端出了Claude Opus 4.7,第二天又发布了Claude Design设计工具。这两记“组合拳”背后,藏着一个比“降智”更值得关注的故事。


2.1 一切从2月开始

2026年2月初,Anthropic低调推出了“adaptive thinking”(自适应思考)功能。官方话术很漂亮——“让模型根据任务复杂度智能调整思考深度”,背后却是全局节流开关的悄然开启。

开发者们开始陆续反映:Claude在处理复杂工程任务时变得越来越“保守”,越来越容易在多步骤任务中途放弃,甚至开始给出“看起来合理但其实是错的”回答。

一位用户在X上写道:“我还以为最近几周Claude是我自己疯了。它感觉更慢、更懒,像回答前就不思考了。”Reddit上的用户则更加直白:“Claude感觉没那么有意识了,像被做了脑叶切除术。”

2.2 AMD总监的“6852次铁证”

真正引爆舆论的,是AMD AI集团高级总监Stella Laurenzo的一记重锤。她直接甩出了近三个月内6852次真实会话的监测日志,涵盖17871个思考块和次工具调用,用数据量化了开发者们数周以来的糟糕体验。

数据触目惊心:

  • 思考中位数从2200字符暴跌至600字符,下降67%-73%
  • 编辑前阅读文件次数从6.6次锐减到2次
  • 三分之一的修改完全不读文件就直接动手
  • 3月8日后“懒惰钩子”触发173次,此前从未触发过
  • API成本因重试暴增80倍

Stella Laurenzo在分析中指出,由于推理能力下降,模型在修改代码之前逐渐不再完整阅读代码,而是“默认采取成本最低的操作”。她更是直言:“当思考流于表面时,模型会采取最低成本的操作。”

2.3 Anthropic的回应点燃更大怒火

面对铺天盖地的质疑,Anthropic的Claude Code负责人Boris Cherny终于发了一条官方回复。他表示,“adaptive thinking”影响的是思考的显示而非底层推理,并坚持这是“有意优化”而非bug。如果用户想要更好的效果,可以手动把effort调到high。

翻译成人话就是:降智不是bug,是我们特意做的产品优化,你们自己调参数就行。

这番回应瞬间点燃了更大的怒火。关键在于,从2月中旬到4月初,Anthropic从未提前公告任何重大变更。大量付费用户在毫不知情的情况下,订阅费用一分没少,模型却被悄然节流。

一位用户绝望地写道:“你以为你在购买一张通往未来AGI的船票,实际上,船长为了省油,偷偷关掉了雷达。”


就在舆论发酵到最热的时候,2026年4月16日,Anthropic悄然推出了Claude Opus 4.7。这个时机,耐人寻味。

3.1 官方宣称的升级亮点

Anthropic给Opus 4.7打上了“软件工程领域的显著提升”标签,并引入了一个全新的xhigh努力等级。官方宣称的升级包括:

  • 编程能力大幅提升:SWE-bench Pro从前代53.4%跃升至64.3%,提升近11个百分点
  • 视觉能力提升3倍:支持长边达2,576像素的高分辨率图像
  • 更严格地遵循指令:从“善意理解”转向“逐字执行”
  • 输出前自我验证:能在报告结果前主动验证输出
  • 记忆能力增强:改进基于文件系统的记忆系统,可跨会话调取信息

3.2 用户实测:真有说的那么好?

然而,发布之后用户的评价可没有官方宣传的那么乐观。不少用户认为编程能力反而是倒退的,还不如Opus 4.6,甚至有人怀疑现在的Opus 4.7其实就是之前的Opus 4.6改出来的。

X上也是一片吐槽,认为提升不明显,甚至倒退了。有评论一针见血地指出:“当全网都在骂4.6变笨时,4.7的‘增强’听起来更像是官方在被追着打的情况下匆忙端出的补丁。”

3.3 更微妙的地方:主动“削弱”

Opus 4.7还有一个非常引人注目的特点——Anthropic主动对其进行了“削弱”。

Anthropic在训练过程中专门针对网络AI攻防方面的能力进行了“削弱”,并引入了一套安全防护机制,能够自动检测并拦截被禁用或高风险的请求。

更值得玩味的是,Anthropic在公告里直接写道:Opus 4.7的能力不如Claude Mythos Preview——而Mythos只对Apple、Google、Microsoft、Nvidia等少数合作伙伴开放,普通开发者和用户无法使用。

这意味着什么?你付费能用的,不是最强的。

3.4 评测报告中的一个“诡异”数字

Opus 4.7的跑分表里有一个异常数字:长上下文基准MRCR v2 @1M从Opus 4.6的78.3%跌到32.2%,46个百分点的暴跌。很少有旗舰模型迭代会把自家王牌能力砍掉一半。

这不是能力下滑,而是有意的取舍。正如一篇评论所说:“Opus 4.7是一次根本没有想做成‘最强模型’的发布,它是一次有明确取舍的,‘精准刀法’式的发布。”

3.5 成本暗涨:Token消耗增加

Opus 4.7的定价与4.6保持一致——输入每百万token 5美元,输出每百万token 25美元。但这是“明涨实降”。

官方表示,Opus 4.7引入了全新分词器,同样的文本会拆分出比原来多1到1.35倍的token,叠加上模型在高强度任务中倾向于更长的思考,这意味着消耗必然上升。


在Opus 4.7发布后的第二天(4月17日),Anthropic宣布推出Claude Design——一款基于Claude Opus 4.7驱动的AI设计工具。

4.1 它是什么?

Claude Design是一款面向“有想法但没有设计背景”人群的视觉创作工具。用户通过自然语言描述需求,AI就能生成设计稿、产品原型、幻灯片、单页文档等视觉作品。

核心功能亮点:

  • 自然语言生成初版设计:说一句“帮我设计一个冥想App的界面”,AI就能生成初版
  • 多方式精细化调整:对话、行内评论、直接编辑、自定义滑块
  • 品牌系统自动应用:读取企业代码库与设计文件,自动应用统一的配色、字体和组件规范
  • 多源导入支持:文本提示词、图片、DOCX、PPTX、网页元素
  • 无缝导出:PDF、PPTX、独立HTML,或打包移交Claude Code开发

4.2 市场反应:Figma股价应声下跌

Claude Design发布当天,Figma的股价下跌了约7%。

华尔街似乎认为,Anthropic的这款AI设计工具可能对Figma和其他设计软件构成严重威胁。Gizmodo的标题直接就是《Anthropic Launches Claude Design, Figma Stock Immediately Nosedives》。

值得注意的是,就在几天前,Anthropic的首席产品官Mike Krieger刚刚辞去了Figma董事会的职务。这个时间点,很难不让人联想。

4.3 战略意义:从模型到应用

Claude Design的发布,标志着Anthropic不再只是想卖模型,而是要把“输入一句话就出一个能用的产品”这件事自己做出来。

正如一篇分析所指出的:“Anthropic不再只想卖模型,它要把‘输入一句话就出一个能用的产品’这件事自己做成产品。”

这种“双管齐下”的策略,一边不断迭代模型(Opus系列),一边向应用层拓展(Claude Design),正在重塑AI行业的竞争格局。


回过头来看这场“降智”风波,一个更尖锐的问题浮出水面:Claude的“变笨”真的是意外吗?

5.1 商业化驱动的必然

从数据来看,Claude的降智很可能是有意为之。2月9日,“自适应思考”默认引入;3月3日,Opus 4.6默认思考等级effort被调到“中级”(medium);同时思考过程摘要被快速隐藏,用户再也无法一眼看出模型到底想了多深。

同一时期,Anthropic连续发布14个小版本更新,却遭遇5次大规模宕机,显示出算力和负载压力已经逼近极限。

5.2 “看人下菜碟”的AI

一篇分析文章直接以《Claude故意降智,模型也开始“看人下菜碟”?》为题,指出Claude的降智并非孤例,而是整个AI行业进入商业化下半场的缩影。

Stella的测算很直白:按AWS Bedrock的on-demand定价口径,她团队3月的实际推理成本约为42,121美元,而同月实际支付的Claude订阅费用……

说白了:为了控制成本、降低负载,Anthropic选择了“节流”。

5.3 更可怕的真相:能力分层

这场降智风暴背后,其实有一个更值得警惕的现象:模型能力已经开始分层。

普通付费用户能用到的能力,已经不是最前沿的了。最强的Mythos只向少数顶级合作伙伴开放,普通开发者用不上。

正如一位分析师所指出的:“用户能够付费使用的模型,本质上是受到安全机制限制的精简版。” 

这意味着,AI的能力正在从“普世开放”走向“阶层分化”。最好的工具,不一定给你用。


从Opus 4.6的“降智”风波,到4.7的争议性发布,再到Claude Design的跨界出击——Anthropic正在用一套组合拳告诉市场:别只盯着排行榜上的分数看。

这次发布最值得关注的三点:

  1. Opus 4.7是一次有明确取舍的迭代:编程能力确实提升了,但长上下文等能力大幅退步,Token消耗也在悄悄上涨
  2. 降智事件揭示了AI商业化背后的算力矛盾:在资本压力和用户需求之间,厂商选择“节流”或许只是开始
  3. Claude Design表明Anthropic正在从“卖模型”转向“卖产品”:Figma股价的下跌说明市场嗅到了危机

Anthropic现在年化收入已经超过300亿美元,估值被开到8000亿美元。在资本的压力下,这家公司正在走一条与OpenAI截然不同的路——不是卷分数,而是卷场景、卷产品、卷商业化落地。

至于这条路最终会把开发者带到哪里?也许等到Mythos真正开放的那一天,答案才会揭晓。在此之前,我们每个人能做的,大概就是在提示词里悄悄加上一句:“请多读几遍再回答。”

小讯
上一篇 2026-04-19 18:24
下一篇 2026-04-19 18:22

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/271724.html