AI范儿 · 今日速评⏱ 6 分钟
今天 OpenAI 把 Codex 全面升级了,这个升级其实非常重磅,但似乎完全被 Opus 4.7 的声音掩盖了。
以前它只是个帮程序员写代码的小助手,现在直接能接管你整台电脑。打开 App、点按钮、敲键盘,它自己来。
OpenAI 憋了半年的"超级 App",今天露出了第一块骨头。
01Codex 这次到底变成了啥?
先说一个背景。
Codex 原本是 OpenAI 给程序员用的编程工具,每周300 万开发者在用它写代码、改 bug。
但今天这次更新,OpenAI 把它的定位拔高了一截。
官方给它起的新名字叫:Codex for (almost) everything。几乎能干所有事的 Codex。
最核心的变化就一条:它能直接操作你电脑上的任何软件了。
看屏幕、点鼠标、敲键盘,不需要 API,不需要插件,你电脑上装的啥它都能用。
▲ 图:Codex 现在能像人一样操作电脑
这听起来耳熟吗?
对,就是 Claude 之前那个"电脑操作"功能的翻版。OpenAI 这次算是正面开干了。
能操作电脑说基本上人能干的事儿它都可以做,我试了发微信、发朋友圈、甚至总结群聊,完全都没问题,让它去上网找个东西更是不在话下。
02一次塞了一堆新玩意儿
光能操作电脑还不够刺激。这次更新一口气塞了 5 个功能,我做了张图你一眼看全:
内置浏览器 做网页时直接预览 指哪改哪 内置画图 gpt-image-1.5 模型 产品原型、PPT 配图 90+ 新插件 JIRA / GitLab / Slack Notion 微软全家桶 长期记忆 记住你的偏好 下次直接上手 ⏰ 自排任务 给自己安排几周后 时间到自己醒来干 + 还有更多细节
▲ 图:Codex 这次新增的 5 大能力一览
下面我一个个展开说,每个都配了官方的演示视频片段。
内置浏览器:指哪改哪
这个功能专治"前端开发沟通难"。
以前你要改一个网页样式,得跟 AI 描述半天:"就是那个蓝色按钮上面的,标题左边的内边距,要再大一点点"。
现在不用了。Codex 自带浏览器能直接渲染你的网页,你在页面上点哪里,留一条评论,Codex 自动就去改对应的代码。
OpenAI 发布会的 Demo 现场,工程师直接在一张图表上点了一下:"这个 Y 轴被截断了,改一下边距。" Codex 两秒内就把代码改完了。
▲ 视频:内置浏览器 + 评论功能演示
这个功能非常实用,但说实话也不是它首创的。用过谷歌 AIStudio 的朋友会知道,早就有这个功能了。
内置画图:原型图一条龙
接了 OpenAI 最新的 gpt-image-1.5 模型。
这意味着 Codex 现在能在同一个工作流里,一边写代码、一边画图。做产品原型、做游戏素材、做营销 PPT 配图,全都原地完成,风格还能保持一致。
OpenAI 的演示里,Codex 一次性生成了几百张风格统一的游戏素材,从背景、角色到道具,全部从零画出来。
▲ 视频:内置 gpt-image-1.5 批量生成资产
111 个新插件:工作流全接通
这次一次性接通了 111 个第三方工具,覆盖几乎所有常见工作流。
包括 JIRA、GitLab、Slack、Gmail、Notion、微软全家桶,以及所有支持 MCP 协议的服务。
这里顺便说一句:MCP 协议是 Anthropic(Claude)提出的标准,OpenAI 这回也老老实实接入了。
AI 圈的技术收敛越来越明显。
▲ 视频:跨 JIRA / Slack / Notion 一条龙办公
长期记忆:不用每次从零讲
Codex 现在能记住你的偏好、项目习惯、过去聊过啥。下次新任务时,它自己就知道你要的是啥风格、用啥工具链。
更有意思的是主动建议。早上起来,Codex 可能会提醒你:"你昨天那个 Google 文档,同事留了个评论,要不要我先帮你起草个回复?"
从"被动工具"变成"主动助理",这一步很关键。
⏰ 自排任务:最骚的一个
Codex 可以给自己安排"几天甚至几周后"的任务,时间到了自己醒过来接着干。
举个例子:你丢给它一个任务"帮我追踪这个 GitHub PR,等 reviewer 回复后自动整理反馈发我"。
Codex 就会隔几小时自己去看一眼,有动静就继续推进,没动静就安静等着。
等于你雇了个不下班的实习生。
03但我必须泼一盆冷水
别光看 Demo 激动。
实测下来,Computer Use 真的慢。
这个"AI 替你点鼠标、敲键盘"的功能,Demo 里看起来很顺滑。但真的让它在你电脑上干一个完整任务,你会发现它的节奏大概是这样:
截屏 → 分析屏幕 → 决定点哪里 → 移动鼠标 → 点击 → 再截屏 → 再分析……
每一步都要"看一眼"再"想一下"。一个你自己 10 秒钟能完成的操作,AI 可能要花两三分钟。
比如我让我整理下某个群,今天上午都聊了些啥,它足足花了 15 分钟,我手动操作都比它快。。

这不只是 Codex 的问题,Claude 的 Cowork 也一样慢。根本原因是:屏幕上的像素信息太复杂了,模型每次都要重新"看懂"当前状态。
OpenAI 说它的"秘密酱汁"是让 AI 在后台用其他 App,你可以同时继续干自己的事。这确实缓解了"占用屏幕"的问题,但慢还是慢。
所以短期内,Computer Use 更适合"可以放着不管的后台任务",不适合"你急着要结果的实时操作"。
04OpenAI 越做越像 Claude
这次升级看着功能一堆,但把它们拆开来看,你会发现一个很有意思的现象。
OpenAI 几乎每一个新功能,Anthropic 早就做了。
功能 OpenAI Codex Anthropic Claude 电脑操作 今天才上线 ✓ 2025 年就有 代码生成 Codex 编程能力 ✓ Claude Code 插件/协议 接入 MCP ✓ MCP 的发明者 长期记忆 预览中 ✓ Projects 已稳定 桌面 App 今天才推新版 ✓ 已发布多版 内置浏览器 ✓ 首发 尚无对应
▲ 图:Codex 新功能与 Claude 早期版本的对照
看完这张表,你应该明白我想说啥了。
OpenAI 这次的升级,本质上是向 Claude 看齐。电脑操作、MCP 协议、代码 Agent、长期记忆,这些都是 Claude 早就在做的事。
真正算"原创"的只有内置浏览器那一个。
再往下一层:都在向"小龙虾"靠齐
如果说 Claude 是 OpenAI 的"老师",那OpenClaw(小龙虾)更像是这整个方向的"早期样板"。(当然,小龙虾除了一些创新点以外,基本都是照搬 Claude 的。)
小龙虾从一开始就是冲着"能动手的个人 AI 助理"这个定位做的:
1跑在你自己电脑上,不是云端
2通过聊天软件(飞书/)跟你对话
3可以自由切换大模型(谁便宜用谁)
4能无限扩展技能(装什么 Skill 都可以)
5能自排后台任务(定时跑、持续监听)
你再看看 Codex 这次新加的能力:这几条几乎全都对上了。
不同的是,小龙虾是开源的、本地的、免费的。Codex 是订阅制的、云端的、需要 ChatGPT 账号。
大厂在抄方向,开源社区在抄产品。最终体验收敛到同一个形态。
今天 Codex 这次升级,单看是个开发者工具更新。
但往大了看,这是 OpenAI"超级 App"战略落地的第一块砖。
以后你的电脑大概会变成这样:你只管下指令,跨 10 个软件的杂活儿全交给 AI 跑腿。
AI 这两年最大的变化,不是它变聪明了,而是它终于长出了手和脚。
你最想让 AI 替你干哪件杂活?评论区告诉我。
觉得有用 → 点个❤️在看转给那个天天喊"AI 还不够好用"的朋友
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/269549.html