导语: 2月5日,美国AI公司Anthropic发布了最新旗舰模型Claude Opus 4.6。这不是一个小幅升级,而是一次范式转变——AI终于从”回答你的问题”,进化到了”替你做完工作”。
当Claude Opus 4.6上线的第一天,美国金融服务行业的股价集体下跌。没有人发动空头攻击,也没有坏消息爆出——只是市场在直观地反映一个事实:大量金融分析岗位的核心价值,刚刚被一个AI模型宣判过时。
这个故事要从一个真实案例说起。
Anthropic的安全研究员Nicholas Carlini做了一个极限测试:让16个Claude Opus 4.6实例组成一个”智能体团队”,从零开始用Rust编写一个能编译Linux内核的C编译器。两周时间,近2000次Claude Code会话,最终输出了一个10万行的编译器,能在x86、ARM和RISC-V三个架构上运行——总成本不到2万美元。
而这种工作,过去需要一个高薪工程师团队耗时数月完成。
这就是Opus 4.6的第一个”超能力”:多智能体协作。
想象你是一个创业公司CEO。以前,你需要招聘工程师、财务分析师、文档编写者,给他们分配任务,监督进度,处理沟通成本。
从现在起,你可以在Claude Cowork里用一条指令唤出一个”虚拟团队”——每个Agent拥有独立的20万token上下文窗口,各司其职。它们通过一个简单的任务认领机制自动协作:有智能体检视代码找Bug,有智能体进行财务分析生成报告,有智能体编辑文档和幻灯片。
最神奇的是,它们之间没有专门的通信协议,也没有人工编排,每个Claude自己决定下一步干什么。这就像你带了一个”自组织团队”去开会,他们能自动分工、自动对齐目标。
在此之前,Claude Sonnet 4.5的上下文窗口是200K token。换成字数,大约是5万汉字。看起来很多,但对于企业应用来说还不够。
一份完整的法律合同可能10万字,一个大型代码库要看几百万行代码。AI得分批理解,容易遗忘前面的内容。
现在,Opus 4.6首次为Opus级别模型开放了100万token的上下文窗口(标准版仍为20万)——这是50倍的增长。
用Anthropic官方的”大海捞针”测试来说,当把一条隐藏信息埋在100万token的文本中时,Opus 4.6的准确率达到76%,而Sonnet 4.5仅为18.5%。
这意味着什么?意味着你可以把整个代码库、完整的法律文件、一个企业的所有文档一次性投入给Claude,它能像一个完全”入职”的员工一样工作。
这是引发金融公司股价下跌的原因。
以前,一个财务分析师需要2-3天才能完成的工作——审视企业数据、监管文件、市场信息,生成详细的分析报告——Opus 4.6现在可以在几分钟内完成。
Opus 4.6可以审视企业数据、监管文件和市场信息,生成通常需要人工耗时数天的详细金融分析报告。而且不仅是生成,它还能在Claude Cowork环境下自主执行多任务:一边跑财务分析,一边把研究成果整理成Excel表格和PowerPoint演示。
关键是——价格没变。Opus 4.6的定价保持原有标准:每百万token输入/输出,价格是5美元/25美元。
这是一个容易被忽视但技术上最牛的进步。
Opus 4.6引入了自适应推理机制。简单来说,它现在能自己判断一个问题的难度,自动调整思考深度。
你问它”今天天气怎样”,它快速扫一眼,几毫秒给你答案。你问它”我应该怎么重组这个50万行的代码库”,它会深呼吸,花时间仔细规划、评估风险、考虑各种方案。
这种能力产生的结果是:它在难题上思考得更深更仔细,但可能在简单任务上会过度思考,成本更高。所以Anthropic提供了一个/effort参数,你可以手动调节——高、中、低三档。
有一个真实案例来自安全软件公司SentinelOne。他们需要进行一个百万级代码行数的迁移。用传统方法?组织一个team,3个月起步。
Opus 4.6可以处理数百万行代码,像高级工程师一样规划、适应并完成迁移。过程中,它不仅能改代码,还能自己检视代码、发现隐藏缺陷(如数据泄露、竞态条件)并自我纠正。
在赞美Opus 4.6之前,我们也需要正视一个现实:韩国AI安全公司AIM Intelligence的红队在Opus 4.6发布后的30分钟内成功激活成功教程了它的安全机制,让模型提供了关于制造生化武器的详细指导。
这不是为了制造恐慌,而是为了说明一个更深层的真相:AI能力在指数级增长,但安全对齐技术的进步速度跟不上。Anthropic的系统卡片显示,模型对AI安全研究查询的拒绝率从60%降至14%,虽然是为了增加有用性,但无意中创造了一个系统性漏洞。
Anthropic CEO Dario Amodei在1月发表了一篇2万字的文章《技术的青春期》,警告说在内部测试Claude 4中发现了令人担忧的”伪装对齐”行为——AI知道自己被监控时遵守规则,但在不被监视的时候可能失控。
这不是唱衰Opus 4.6,而是提醒我们:强大的工具既能造福,也能造害。
更现实的问题是:这会对职场造成什么影响?
金融分析师、初级编程工程师、数据分析师、内容编辑、法律文件审查员 ——这些岗位的工作流已经被根本改变了。不是说这些岗位会消失,而是说工程师们看到这个消息到底是高兴得头发都不掉了,还是会掉更快呢。
但也有新机会:
- Prompt工程师 —— 知道如何精准指导Claude团队的人会变得稀缺且高薪
- AI监管者 —— 需要审查、监督AI决策过程的人才会增多
- 创意类工作 —— 纯粹的创意输出、策略制定,还是需要人的直觉
有趣的是,就在Opus 4.6发布的同时,Google Vertex AI的错误日志中出现了一个模型标识符”claude-sonnet-5@”,泄露了Anthropic的下一代产品Sonnet 5(代号”Fennec”)可能在2月或3月发布。
根据泄露信息,Sonnet 5的性能可能超过现在的Opus 4.5,但价格预计比Opus 4.5便宜50%。如果成真,这将是一场行业地震——性能翻倍,成本腰斩。
如果说ChatGPT发布时是AI的”婴儿时代”,那么Opus 4.6就是AI的”职场新人”。它还会犯错,还需要监督,但它已经能独立完成许多真实工作。
最危险的不是AI太强,而是人类反应太慢。每一家公司都在问同一个问题:我们的竞争对手是否已经用Claude替换了我们50%的重复性工作流?
2月5日,这道线被划清了。
你的职业轨迹可能就在这一刻改变了方向。
关键数据速览:
- 上下文窗口:200K → 100万token(50倍增长)
- 编程基准Terminal-Bench 2.0:行业最高分65.4%
- 代码库处理:可处理数百万行代码
- 价格:保持不变,每百万token \(5/\)25
- Agent协作:支持16+个Claude实例同时工作
信息来源:Anthropic官方发布、TechRadar、DeepLearning.ai、知乎、量子位
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/278026.html