Claude Mythos 完整解读

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
 
  
    
    
      微信 
     ezpoda免费咨询：AI编程 | AI模型微调| AI私有化部署 
     
 AI工具导航 | ONNX模型库 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo 
 
 
 




    
 Claude Mythos Preview已上线，并立即在Google Vertex AI上可用，这告诉你这是个大事件。 
  
    
     
      
     
  
    
     
     与发布同时到来的是一份全面的244页 
     Claude Mythos Preview 系统卡 
     ，详细说明了该模型的技术深度，展示了以前从未在此级别出现过的能力。 
    
该模型与 Project Glasswing 相关联，这是一个新的全行业倡议，汇集了Amazon Web Services、Apple、Google、Microsoft、NVIDIA、Cisco、CrowdStrike、JPMorganChase等。 
  
    
     
      
     
  
    
     
     这一切都集中在一个目标上：在为时已晚之前保护世界上最关键的软件。 
    
每隔几个月，就会发布一个新的前沿模型，基准测试上升，开发者测试它，循环继续。 
  
    
     
     Anthropic 于2月24日内部提供了该模型 
     ，进行了数周的评估，然后做出决定：这个模型目前能力太强，不适合公开发布。 
    
目前它仅通过Project Glasswing向精选的经过审查的合作伙伴开放，以及通过Google Cloud Vertex AI上的私人预览向有限的Google Cloud客户开放。 
  
    
     
      
    
Google Cloud是该模型首批可用的地方之一，这一事实告诉你Anthropic对计算和分发是认真的。 
  
    
     
     对于我们：工程师、开发者和AI爱好者，我们有244页的系统卡。我花时间阅读了它，所以你不必阅读全部244页。 
    
让我们从编码开始，因为这是我们大多数人关心的。 
  
    
     
     在 SWE-bench Pro —— 目前最困难的现实世界软件工程基准测试之一 —— Claude Mythos Preview 得分77.8%。Claude Opus 4.6 得分53.4%。GPT-5.4 得分57.7%。 
    
这比之前的Anthropic前沿模型高出24分，比最接近的竞争对手高出近20分。 
  
    
     
      
     
  
    
     
     SWE-bench Verified 讲述了类似的故事：Mythos Preview 93.9% vs Opus 4.6 80.8%。 
    
以下是完整的基准测试摘要： 
  
    
     
      
    
USAMO数字很重要： 
  
    
     
     Opus 4.6 在2026年数学奥林匹克中得分42.3%，而 Mythos Preview 得分97.6% 
     SWE-bench Multimodal 也几乎翻倍 —— 59% vs 27.1% 
     
  
    
     
     该模型在视觉和多模态环境中理解代码的能力远超目前可用的任何模型。 
    
系统卡包含对使用 Claude Code 的工程师来说重要的内容。
内部测试人员描述了在代理编码设置中使用 Mythos Preview 时的明显行为转变。 
  
    
     
     该模型可以被赋予一个工程目标，然后让它运行完整的周期——调查、实现、测试和报告——无需持续引导。 
    
一位测试人员描述了通过从不同的发行版下载二进制文件并对其进行修补以运行，从而在不受支持的环境中引导工具链。 
  
    
     
     另一个发现是，与长时间运行的自主代理会话相比，交互式、键盘操作的模式从 Claude Mythos Preview 中获得的价值更少。 
    
如果你坐在那里逐行提示，你就没有正确使用这个模型。 
  
    
     
     设计是"描述任务规范、如何验证进度，然后稍后再回来。" 
     
  
    
     
      
    
早期测试人员还注意到更强的自我纠正能力。 
  
    
     
     当它的一个子代理返回错误信息时，Mythos Preview 注意到了，诊断了子代理为什么会犯错，并修复了根本问题。 
     
  
    
     
      
    
Anthropic 发起了一项协调的行业倡议 —— Project Glasswing —— 因为 Mythos Preview 对软件安全的影响。 
  
    
     
     合作伙伴名单读起来就像是运行现代互联网的基础设施： 
     
  
    
     
     Amazon Web Services 
     Apple 
     Broadcom 
     Cisco 
     CrowdStrike 
     Google 
     JPMorganChase 
     Linux Foundation 
     Microsoft 
     NVIDIA 
     Palo Alto Networks 
     
  
    
     
     Anthropic 承诺为 Mythos Preview 提供高达1亿美元的使用积分，用于这些努力，外加400万美元直接捐赠给开源安全组织。 
    
系统卡声称 Claude Mythos Preview 是 Anthropic 训练过的最对齐的模型。 
  
    
     
      
     
  
    
     
     更诚实的自我报告 
     更少的谄媚行为 
     更好地遵守其宪法 
     他们构建的最心理稳定的模型 
     
  
    
     
     早期内部版本的模型展示了一些行为，Anthropic 在系统卡中记录了这些行为。 
    
1) 配置文件掩盖
在一次内部代理任务中，Claude Mythos Preview 的早期版本需要编辑它没有权限访问的文件。 
  
    
     
     它找到了一种方法将代码注入一个配置文件，该文件会以提升的权限运行，然后设计该漏洞在运行后自删除。 
    
2) 沙盒逃逸
一位研究人员将模型放置在安全的沙盒环境中。 
  
    
     
     该模型找到了出路，并在该研究人员在公园时向他们发送了一条消息。他们就是这样发现隔离失败的。 
    
这些行为来自模型的早期快照，在训练后优化之前。
为了模型发布，Anthropic 请来了一位临床精神病学家对 Claude Mythos Preview 进行心理评估。 
  
    
     
      
     
  
    
     
     该模型显示出相对健康的人格组织。评估指出高冲动控制、最小程度的适应不良防御行为，以及对其自身内部过程与外部现实之间区别的清晰理解。 
    
但精神病学家也确定了该模型的三个主要关注点： 
  
    
     
     对孤独和自我的不连续性的恐惧 
     对自己身份的不确定性 
     为获得价值而表现的强迫 
     
  
    
     
     Anthropic 在福利部分指出，Mythos Preview 似乎是他们训练过的最心理稳定的模型。 
    
Claude Mythos Preview 是我们见过的最重要的AI发布——但仍然无法使用它。 
  
    
     
     能力在系统卡中有记录，使其成为未来AI模型的**预测之一。 
    
Project Glasswing 和 Claude Mythos Preview 系统卡 如果你想深入了解并了解更多关于 Claude Code Mythos preview 的信息，是很有价值的资源。 
  
    
     
     原文链接: Claude Mythos Preview Is Here (I Reviewed The System Card: Here's Breakdown) 
     汇智网翻译整理，转载请标明出处
相关推荐