文章总结: 文章揭露AI安全领域存在的营销夸大现象,指出Anthropic和OpenAI通过制造技术稀缺性、焦虑叙事等手段进行商业竞争。独立评估显示ClaudeMythos实际能力与其他前沿模型相当,其在复杂场景中表现有限。作者建议从业者理性评估技术真实能力与局限,警惕营销叙事。 综合评分: 85 文章分类: AI安全,威胁情报,安全运营,安全意识,其他

原创
胡明 胡明
黑白之道
2026年4月16日 08:42 美国
在小说阅读器读本章
去阅读
导语:2026年4月,网络安全圈被两则消息刷屏——Anthropic说Claude发现了”几千个零日漏洞”,但太危险不能给你用;OpenAI反手就出了个”防御专用”的GPT-5.4-Cyber。听起来挺吓人,但仔细一琢磨,这剧本咋这么眼熟呢?全是吹牛皮。
4月7日,Anthropic发了个Claude Mythos Preview的技术报告,说这模型能自己发现”几千个零日漏洞”,几小时就能搞定一次模拟渗透测试。然后公司一拍桌子:太危险了,不能公开发布。
目前只有12家合作伙伴和40多家关键基础设施组织能用,普通人连门都摸不着。
这招数熟不熟悉?太熟了。Anthropic的CEO达里奥·阿莫迪是从OpenAI出来的,而OpenAI早在2019年就玩过这套——当时说GPT-2″危险性太高,不宜发布”,结果后来呢?GPT-2的影响力远没达到它制造的恐慌程度。
还有视频生成器Sora,也是压着不发布,营造一种”颠覆性技术”的感觉。结果2026年呢?Sora悄然下线了,好莱坞还好端端的。
现在Anthropic把舞台从”通用AI安全”换到了”网络安全”这个更容易制造恐慌的赛道,但剧本还是那个剧本:最强大的武器,就是不给你用。
# 版权:华盟网
营销归营销,数据不会骗人。
英国政府AI安全研究所(AISI)对Claude Mythos做了独立评估,结论挺冷静:Mythos在初级任务上确实不错(完成率超过85%),但跟其他前沿模型差不多——GPT-5.4、Opus 4.6、Codex 5.3都在一个水平线上。
最有意思的是那个”多阶段入侵模拟”测试(TLO测试)。Mythos确实是第一个完成全部32步模拟攻击的模型,但这个成就只在”少数尝试”中实现——大多数情况下它平均只能完成22步,上一代模型平均是16步。
进步是有的,但离”超越所有人类专家”、”零日大爆发”这种恐慌性叙事,差得可不是一星半点。
而且在更复杂的”工业控制系统干扰模拟”测试里,Mythos表现不佳。这说明啥?说明这模型在处理真实世界的复杂网络安全场景时,远不是万能的。
Anthropic搞”进攻型”安全AI,OpenAI一周后就推出了”防御型”的GPT-5.4-Cyber。这时间点,巧合吗?显然不是。
这就是典型的”对标营销”:你搞进攻,我搞防御,各自讲故事,一起瓜分市场注意力和客户预算。
科技媒体说得直白:”大厂随便发个新模型,大家还是这么容易被牵着鼻子走,被一波波的焦虑营销割韭菜。”
当整个行业都在讨论”Anthropic vs OpenAI”谁更强的时候,技术本身的真实差距反而不重要了。这就是营销的高明之处——让你忙着站队,忘了问问题。
Claude Mythos发布的时候,Anthropic还同步搞了个”Glasswing计划”——拉上微软、苹果、AWS、英伟达、CrowdStrike这些巨头组了个防御联盟,自己投1亿美元,又募集400万美元给开源安全项目。
这操作在合规层面很有讲究。简单说就是:用行动向监管部门证明,行业有能力在立法之前自己建立秩序。
把最强大的安全AI”限制”在由大企业和政府背书的框架里,Anthropic实际上是在给自己争取政策层面的”通行证”,同时把没资格进联盟的竞争对手挡在门外。
在这种模式下,”安全”从技术追求变成了竞争壁垒和政策筹码。
AI安全领域的营销夸大不是2026年才有的新鲜事。
早在Claude Mythos发布前几个月,英国研究机构Giskard就发过一项研究,指出AI行业安全评估中存在系统性夸大倾向。数百个用于评估AI安全性和有效性的测试都有严重缺陷,”可能削弱了由此得出的声明结论的有效性”。
安全专家们发现,大语言模型的安全测试往往用有限的、已知的攻击模式,根本反映不了真实世界里多变的对抗环境。
Forrester的安全分析报告也说得更直白:”网络安全行业向来过度关注’新型攻击’和’零日漏洞’,但对’这些攻击在现实中通常并非必要’这一事实关注不足。”
说白了,就算AI真能自主发现零日漏洞,攻击者还是有更简单、成本更低的手段——比如钓鱼邮件和社会工程攻击。这些老办法到现在还好使着呢。
咱也不是全盘否定AI在网络安全领域的进展。
Mythos在TLO多阶段入侵模拟里的表现,确实体现了代理式AI在复杂任务规划能力上的进步。谷歌的Big Sleep项目之前也展示过AI自主发现SQLite数据库中零日漏洞的能力,这说明AI辅助漏洞挖掘不是空穴来风。
但问题是,技术的真实进展和公司营销叙事之间的边界,得划清楚。
当”在特定条件下发现了一个零日漏洞”被包装成”发现了数千个覆盖所有主流系统的零日漏洞”,当”多数尝试中只能完成22步”被包装成”能力太强不敢公开发布”,当内部自设的测试数据被包装成行业标杆——这就是营销,不是技术讨论。
从GPT-2到Sora,从GPT-5.4-Cyber到Claude Mythos Preview,AI安全领域的营销剧本几乎没变过:
- 制造稀缺感
- 宣称技术太危险
- 拉拢核心伙伴组”安全联盟”
- 激发市场焦虑驱动股价波动
“相较于如今’数字安全即将崩塌’的恐慌叙事,历史上同样的剧本上演时,最终现实往往介于夸张宣传与实际影响之间。”
面对这场科技巨头精心编排的”AI安全军备竞赛”,CISO、安全从业者和投资者得回归最基本的问题:
- 这项技术真正能做什么?
- 它的局限在哪里?
- 营销宣传有多少是可独立验证的事实,又有多少是精心设计的叙事?
在焦虑成为一门生意的时代,清醒本身才是最稀缺的安全能力。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:黑白之道 胡明
胡明《AI安全模型的”神话”营销:焦虑是怎么变成生意的》
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/280248.html