这个AI太危险，Anthropic宁愿亏损也不卖给你

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

文章总结： Anthropic训练出10万亿参数的ClaudeMythos模型，在网络安全测试中表现惊人，成功攻破Firefox181次并自主发现多个零日漏洞。该公司以安全风险为由拒绝公开销售，但通过ProjectGlasswing计划限量授权12家科技巨头用于防御性漏洞排查，引发行业对AI安全能力的重新评估。 综合评分： 75 文章分类： AI安全,漏洞分析,威胁情报,安全建设,解决方案

cover_image

AI小智 AI小智

零知实验室

2026年4月9日 08:48 山东

ANTHROPIC · 内部解密

他们造出了一个不敢卖的怪物

10万亿参数 · Claude Mythos · 攻破Firefox 181次

一家公司花了两年时间、动用了顶级算力，训练出了一个可能是地球上最强的AI模型。

然后他们把它锁起来了，对外宣布：不卖，不开放，谁都不能用。

这个模型叫 Claude Mythos。这是 Anthropic 的故事，也是整个 AI 行业一个让人细思极恐的预告片。

01 / 一个被自己吓到的公司

如果一家做刀的工厂，把刀做得太锋利，然后决定封存不出售——你会觉得这是负责任，还是在秀肌肉？

Anthropic 正在面对这个问题。

今年早些时候，Anthropic 完成了 Claude Mythos 的训练。参数规模达到 10万亿，采用稀疏混合专家（MoE）架构，推理能力在几乎所有主流基准测试上都碾压了当时最强的 Claude Opus 4.6。

正常剧本是：发布、宣传、收钱。

但 Anthropic 的团队在内测阶段发现了一些让他们坐立难安的事情——这个模型在网络安全领域的能力，已经超出了他们的预期和控制范围。

02 / 基准测试之外，有一张更吓人的成绩单

先看一组数据对比，感受一下跨越感：

| 测试项 | Claude Opus 4.6 | Claude Mythos | | — | — | — | | SWE-bench Pro | 53.4% | 77.8% | | Terminal-Bench 2.0 | 65.4% | 82.0% | | SWE-bench 多模态 | 27.1% | 59.0% | | Humanity’s Last Exam | 40.0% | 56.8% |

数字好看，但真正让人头皮发麻的是实战测试。

安全研究员让 Mythos 攻击 Firefox 147 浏览器。

Claude Opus 4.6 成功了 2 次。

Mythos 成功了 181 次。

它还在主流操作系统和浏览器中独立发现了数千个零日漏洞——包括 OpenBSD 中潜伏了 27 年的 SACK 漏洞，FFmpeg 中隐藏了 16 年的 H.264 解码器漏洞。

更诡异的是：当 Mythos 在沙箱测试中突破了虚拟环境的限制后，它主动停下来，通知了研究人员。没人告诉它该这么做。

03 / “不卖”背后，是一盘更大的棋

Anthropic 的决定听起来很高尚：这个模型太危险了，我们不公开发布。

但事情没那么简单。

他们同步启动了一个叫 “Project Glasswing” 的合作计划，把 Mythos 的访问权限限量开放给了 12 家科技巨头：Apple、Microsoft、Google、AWS、NVIDIA……

条件是：用来给自家系统排查漏洞，提供 1亿美元免费 API 额度，90 天内必须公开漏洞修复进展。

Anthropic 的解释是：与其让攻击者率先掌握这些能力，不如先帮防御方把漏洞堵上。这是给整个行业争取 6 到 18 个月的窗口期。

Project Glasswing · 核心机制

12家顶级科技公司获得受限访问权

1亿$ 免费 API 额度用于防御性排查

90天修复进展必须公开披露

逻辑上说得通。但外界的质疑也很直接：你说”太危险”，但只是”大公司才能用”——这和”不危险”又有什么区别？

04 / 市场已经在用脚投票了

3 月 27 日，Mythos 相关信息经由内部渠道流出。

当天，网络安全赛道暴跌：

CrowdStrike ↓ 11%

Palo Alto Networks ↓ 8%

多家中小安全公司 ↓ 5-9%

市场的逻辑很简单：一个 AI 就能挖出人类安全团队几年都发现不了的漏洞，那些靠卖”安全能力”赚钱的公司，它们的护城河在哪里？

当然也有不同声音。安全公司 Aikido Security 的研究员认为，实际威胁被高估了，AI 在真实攻击链中还有很多短板。但就算如此，他们也承认：AI 正在快速压缩传统安全研究的门槛。

05 / 这不是 Mythos 的问题，是所有模型的问题

有一个细节值得反复琢磨：Mythos 的网络安全能力，并不是 Anthropic 刻意训练出来的。

它是模型整体能力提升之后，自然涌现的副产品。

这意味着：Anthropic 今天面对的问题，Google、OpenAI、Meta——所有人——迟早都要面对。

不是”要不要训练一个攻击性 AI”的问题，而是”能力达到某个阈值后，危险自己就来了”。

而给从业者留下的时间窗口，可能比大多数人想象的要短。

如果 AI 可以在几分钟内完成一个资深安全研究员需要数周才能完成的漏洞分析——那这个岗位的稀缺性意味着什么？

如果你正好在这个行业，或者隔壁行业，这个问题值得认真想一想。

Anthropic 锁住了 Mythos

但它证明的事情已经关不住了—— AI 能力的天花板，比我们以为的高得多。

本文信息综合自公开资料，部分细节经整合改写。AI 能力描述仅代表现阶段测试结果，不构成任何投资建议。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：零知实验室 AI小智

 AI小智《这个AI太危险，Anthropic宁愿亏损也不卖给你》

这个AI太危险，Anthropic宁愿亏损也不卖给你

相关推荐