短短两个月内,Claude 经历了从“编程天花板”到“赛博油条”的口碑崩塌,又在骂声中端出了 Opus 4.7 与 Claude Design 两记重拳。这背后,究竟是算力危机、商业考量,还是战略转型?
据 大模型API聚合平台 proaiapi.tech 报道,2026年4月,AI圈掀起了一场前所未有的“信任危机”。
曾经的编程之神——Claude Opus 4.6,在短短两个月内从全球排名第2骤降至第10,被无数开发者指着鼻子骂“降智”。AMD高管用6852次真实会话日志打脸,数据触目惊心:思考深度暴跌67%,代码阅读次数从6.6次降至2.0次。
然而,就在骂声最烈的时候,Anthropic不动声色地端出了Claude Opus 4.7,第二天又发布了Claude Design设计工具。这两记“组合拳”背后,藏着一个比“降智”更值得关注的故事。
2.1 一切从2月开始
2026年2月初,Anthropic低调推出了“adaptive thinking”(自适应思考)功能。官方话术很漂亮——“让模型根据任务复杂度智能调整思考深度”,背后却是全局节流开关的悄然开启。
开发者们开始陆续反映:Claude在处理复杂工程任务时变得越来越“保守”,越来越容易在多步骤任务中途放弃,甚至开始给出“看起来合理但其实是错的”回答。
一位用户在X上写道:“我还以为最近几周Claude是我自己疯了。它感觉更慢、更懒,像回答前就不思考了。”Reddit上的用户则更加直白:“Claude感觉没那么有意识了,像被做了脑叶切除术。”
2.2 AMD总监的“6852次铁证”
真正引爆舆论的,是AMD AI集团高级总监Stella Laurenzo的一记重锤。她直接甩出了近三个月内6852次真实会话的监测日志,涵盖17871个思考块和次工具调用,用数据量化了开发者们数周以来的糟糕体验。
数据触目惊心:
- 思考中位数从2200字符暴跌至600字符,下降67%-73%
- 编辑前阅读文件次数从6.6次锐减到2次
- 三分之一的修改完全不读文件就直接动手
- 3月8日后“懒惰钩子”触发173次,此前从未触发过
- API成本因重试暴增80倍
Stella Laurenzo在分析中指出,由于推理能力下降,模型在修改代码之前逐渐不再完整阅读代码,而是“默认采取成本最低的操作”。她更是直言:“当思考流于表面时,模型会采取最低成本的操作。”
2.3 Anthropic的回应点燃更大怒火
面对铺天盖地的质疑,Anthropic的Claude Code负责人Boris Cherny终于发了一条官方回复。他表示,“adaptive thinking”影响的是思考的显示而非底层推理,并坚持这是“有意优化”而非bug。如果用户想要更好的效果,可以手动把effort调到high。
翻译成人话就是:降智不是bug,是我们特意做的产品优化,你们自己调参数就行。
这番回应瞬间点燃了更大的怒火。关键在于,从2月中旬到4月初,Anthropic从未提前公告任何重大变更。大量付费用户在毫不知情的情况下,订阅费用一分没少,模型却被悄然节流。
一位用户绝望地写道:“你以为你在购买一张通往未来AGI的船票,实际上,船长为了省油,偷偷关掉了雷达。”
就在舆论发酵到最热的时候,2026年4月16日,Anthropic悄然推出了Claude Opus 4.7。这个时机,耐人寻味。
3.1 官方宣称的升级亮点
Anthropic给Opus 4.7打上了“软件工程领域的显著提升”标签,并引入了一个全新的xhigh努力等级。官方宣称的升级包括:
- 编程能力大幅提升:SWE-bench Pro从前代53.4%跃升至64.3%,提升近11个百分点
- 视觉能力提升3倍:支持长边达2,576像素的高分辨率图像
- 更严格地遵循指令:从“善意理解”转向“逐字执行”
- 输出前自我验证:能在报告结果前主动验证输出
- 记忆能力增强:改进基于文件系统的记忆系统,可跨会话调取信息
3.2 用户实测:真有说的那么好?
然而,发布之后用户的评价可没有官方宣传的那么乐观。不少用户认为编程能力反而是倒退的,还不如Opus 4.6,甚至有人怀疑现在的Opus 4.7其实就是之前的Opus 4.6改出来的。
X上也是一片吐槽,认为提升不明显,甚至倒退了。有评论一针见血地指出:“当全网都在骂4.6变笨时,4.7的‘增强’听起来更像是官方在被追着打的情况下匆忙端出的补丁。”
3.3 更微妙的地方:主动“削弱”
Opus 4.7还有一个非常引人注目的特点——Anthropic主动对其进行了“削弱”。
Anthropic在训练过程中专门针对网络AI攻防方面的能力进行了“削弱”,并引入了一套安全防护机制,能够自动检测并拦截被禁用或高风险的请求。
更值得玩味的是,Anthropic在公告里直接写道:Opus 4.7的能力不如Claude Mythos Preview——而Mythos只对Apple、Google、Microsoft、Nvidia等少数合作伙伴开放,普通开发者和用户无法使用。
这意味着什么?你付费能用的,不是最强的。
3.4 评测报告中的一个“诡异”数字
Opus 4.7的跑分表里有一个异常数字:长上下文基准MRCR v2 @1M从Opus 4.6的78.3%跌到32.2%,46个百分点的暴跌。很少有旗舰模型迭代会把自家王牌能力砍掉一半。
这不是能力下滑,而是有意的取舍。正如一篇评论所说:“Opus 4.7是一次根本没有想做成‘最强模型’的发布,它是一次有明确取舍的,‘精准刀法’式的发布。”
3.5 成本暗涨:Token消耗增加
Opus 4.7的定价与4.6保持一致——输入每百万token 5美元,输出每百万token 25美元。但这是“明涨实降”。
官方表示,Opus 4.7引入了全新分词器,同样的文本会拆分出比原来多1到1.35倍的token,叠加上模型在高强度任务中倾向于更长的思考,这意味着消耗必然上升。
在Opus 4.7发布后的第二天(4月17日),Anthropic宣布推出Claude Design——一款基于Claude Opus 4.7驱动的AI设计工具。
4.1 它是什么?
Claude Design是一款面向“有想法但没有设计背景”人群的视觉创作工具。用户通过自然语言描述需求,AI就能生成设计稿、产品原型、幻灯片、单页文档等视觉作品。
核心功能亮点:
- 自然语言生成初版设计:说一句“帮我设计一个冥想App的界面”,AI就能生成初版
- 多方式精细化调整:对话、行内评论、直接编辑、自定义滑块
- 品牌系统自动应用:读取企业代码库与设计文件,自动应用统一的配色、字体和组件规范
- 多源导入支持:文本提示词、图片、DOCX、PPTX、网页元素
- 无缝导出:PDF、PPTX、独立HTML,或打包移交Claude Code开发
4.2 市场反应:Figma股价应声下跌
Claude Design发布当天,Figma的股价下跌了约7%。
华尔街似乎认为,Anthropic的这款AI设计工具可能对Figma和其他设计软件构成严重威胁。Gizmodo的标题直接就是《Anthropic Launches Claude Design, Figma Stock Immediately Nosedives》。
值得注意的是,就在几天前,Anthropic的首席产品官Mike Krieger刚刚辞去了Figma董事会的职务。这个时间点,很难不让人联想。
4.3 战略意义:从模型到应用
Claude Design的发布,标志着Anthropic不再只是想卖模型,而是要把“输入一句话就出一个能用的产品”这件事自己做出来。
正如一篇分析所指出的:“Anthropic不再只想卖模型,它要把‘输入一句话就出一个能用的产品’这件事自己做成产品。”
这种“双管齐下”的策略,一边不断迭代模型(Opus系列),一边向应用层拓展(Claude Design),正在重塑AI行业的竞争格局。
回过头来看这场“降智”风波,一个更尖锐的问题浮出水面:Claude的“变笨”真的是意外吗?
5.1 商业化驱动的必然
从数据来看,Claude的降智很可能是有意为之。2月9日,“自适应思考”默认引入;3月3日,Opus 4.6默认思考等级effort被调到“中级”(medium);同时思考过程摘要被快速隐藏,用户再也无法一眼看出模型到底想了多深。
同一时期,Anthropic连续发布14个小版本更新,却遭遇5次大规模宕机,显示出算力和负载压力已经逼近极限。
5.2 “看人下菜碟”的AI
一篇分析文章直接以《Claude故意降智,模型也开始“看人下菜碟”?》为题,指出Claude的降智并非孤例,而是整个AI行业进入商业化下半场的缩影。
Stella的测算很直白:按AWS Bedrock的on-demand定价口径,她团队3月的实际推理成本约为42,121美元,而同月实际支付的Claude订阅费用……
说白了:为了控制成本、降低负载,Anthropic选择了“节流”。
5.3 更可怕的真相:能力分层
这场降智风暴背后,其实有一个更值得警惕的现象:模型能力已经开始分层。
普通付费用户能用到的能力,已经不是最前沿的了。最强的Mythos只向少数顶级合作伙伴开放,普通开发者用不上。
正如一位分析师所指出的:“用户能够付费使用的模型,本质上是受到安全机制限制的精简版。”
这意味着,AI的能力正在从“普世开放”走向“阶层分化”。最好的工具,不一定给你用。
从Opus 4.6的“降智”风波,到4.7的争议性发布,再到Claude Design的跨界出击——Anthropic正在用一套组合拳告诉市场:别只盯着排行榜上的分数看。
这次发布最值得关注的三点:
- Opus 4.7是一次有明确取舍的迭代:编程能力确实提升了,但长上下文等能力大幅退步,Token消耗也在悄悄上涨
- 降智事件揭示了AI商业化背后的算力矛盾:在资本压力和用户需求之间,厂商选择“节流”或许只是开始
- Claude Design表明Anthropic正在从“卖模型”转向“卖产品”:Figma股价的下跌说明市场嗅到了危机
Anthropic现在年化收入已经超过300亿美元,估值被开到8000亿美元。在资本的压力下,这家公司正在走一条与OpenAI截然不同的路——不是卷分数,而是卷场景、卷产品、卷商业化落地。
至于这条路最终会把开发者带到哪里?也许等到Mythos真正开放的那一天,答案才会揭晓。在此之前,我们每个人能做的,大概就是在提示词里悄悄加上一句:“请多读几遍再回答。”
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/271724.html