今天凌晨,AI圈炸了。
老金我熬夜测了两个模型,今天给你们做个全面对比。
Claude Code和Codex Cli中均已上线。
记得更新
这意味着什么?
再来看个GPT-5.3-Codex最让人震惊的地方。
- 调试自己的训练过程
- 管理自己的部署
- 诊断测试结果和评估
这是Opus 4.6最硬核的技术突破。
76% vs 18.5%,这不是量变,是质变。
OpenAI说GPT-5.3-Codex比5.2版本快了25%。
启用方式: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
赛车游戏,包含不同的赛车手,八张地图,甚至还有可以用空格键使用的道具。
潜水游戏,你将探索各种珊瑚礁,收集所有鱼类以完成你的鱼类图鉴,同时还要管理氧气、压力和应对各种危险。
如果对你有帮助,记得关注一波~
Claude Opus 4.6:
- Terminal-Bench 2.0:最高分
- GDPval-AA:比GPT-5.2高144 Elo点
- Humanity's Last Exam:第一
- BrowseComp:第一
GPT-5.3-Codex:
- 自我构建能力:首个参与自身开发的AI模型
- 25%速度提升(相比GPT-5.2)
- 被标记为"高能力"网络安全任务
- 具体跑分数据尚未公布
Claude的扩展:
- Claude in Excel:直接在Excel里调用Claude
- Claude in PowerPoint:直接在PPT里做演示文稿
- 128k输出tokens:一次性生成更长的内容
包括做幻灯片、电子表格等。
两家都在从"编程工具"向"通用工作助手"进化。
Claude Opus 4.6:
- 输入:5美元/百万token
- 输出:25美元/百万token
- 超过20万token的长上下文:10美元/37.5美元
GPT-5.3-Codex:
- 目前只在付费ChatGPT计划中可用
- API访问计划中,预计会有25%更快的交互
Anthropic:
- 44%的企业在生产环境中使用
- Claude Code 11月突破10亿美元收入
- 正在谈200亿美元融资,估值3500亿美元
OpenAI:
- 三天前刚发布Codex桌面应用
- GPT-5.3-Codex是对Claude Code的直接回应
- 仍然是市场领导者
选Claude Opus 4.6如果你:
- 需要处理大型代码库(100万token上下文)
- 需要长上下文能力(不会"忘记"前面的内容)
- 想用Agent Teams做并行开发
- 需要在Excel/PowerPoint里用AI
选GPT-5.3-Codex如果你:
- 已经是ChatGPT Plus/Pro用户
- 需要网络安全相关的高能力任务
- 喜欢OpenAI的生态系统
老金我的实际做法:两个都用。
2026年2月5日,会被记住。
你们觉得呢?Claude还是GPT?
往期推荐:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/274459.html