OpenAI Codex 负责人：AI 会让程序员变少？答案与你想象的不同

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

Q：主持人，投资人

C：Alexander（Bericos），OpenAI Codex 产品负责人

来源：youtube访谈视频，Mixlab 编辑团队整理优化

OpenAI Codex 产品负责人 Alexander 在本期访谈中，从投资人、从业者与产品构建者三重视角，系统性地回答了关于 AI 编程现状与未来的关键问题。他的核心观点反直觉却有力：AI 不会消灭程序员，而是会让"写代码"这件事变得基础到近乎透明 —— 真正的瓶颈是人类自己愿不愿意张嘴、愿不愿意定义任务。此外，他透露 Codex 自 GPT-5.2 以来用户量增长 20 倍，并预告未来将重新押注云端产品。

Q：你之前说过：人类打字速度和验证工作，是比模型算力或架构更关键的 AGI 瓶颈。这是什么意思？

C：让我先问你：你现在每天使用 AI 多少次？

Q：三十多次吧。

C：如果完全零成本，你认为 AI 每天能帮你多少次？

Q：我觉得应该全天候运行在所有事情上。

C：没错。现在 OpenAI 内部的工程师基本上 Codex 从不关机，甚至在开会时都开着，因为"Codex 没活干"就等于在浪费时间。但问题是：我明知 AI 能帮我做所有事，我却懒得打那么多 prompt，也想不出所有它能帮我的场景。所以我每天用 AI 的次数和你差不多。

我认为 AI 应该每天帮助我们成千上万次，但人类的输入成本太高了。 大多数人不可能为了用好 AGI 而去学怎么写 prompt。真正理想的世界里，你不需要想"AI 能帮我什么"，它就是知道你的上下文，然后适时出现。

C：如果形象地描述，我认为有三阶段：

第一阶段，让 AI 代理先把软件工程和编程做好，因为 LLM 本身就很擅长编程。

第二阶段，让 AI 代理能操作电脑：毕竟编程是 AI 操作电脑最好的方式。然后让所有有好奇心、愿意探索的人都能用上这些工具。

第三阶段，等我们看清什么模式有效了，再做高度产品化的事情，让用户开箱即用。

我们正在加速这个全过程。

Q：Elon Musk 说编程是第一批被大规模自动化的职业，你同意吗？

C：我同意编程是 LLM 最先擅长的领域之一。但"自动化"这个词太重了。举一个例子，我们现在不写汇编了，转向了高级语言，你会说"编程被自动化了"吗？显然不是。我们只是能写多得多得多的代码，结果反而需要更多软件工程师。

历史上也是如此：computer 这个词最初指的是人：在 Bletchley Park 帮 Enigma 机器打孔卡的人。第一代电子表格软件的设计逻辑，其实就是把人组织成网格、做表格计算再往下传递。那些具体任务都被自动化了，但每一次自动化都带来了需求的爆发，反而需要更多人。

所以 5 年后程序员会更多，不会更少。 只不过"程序员"的定义可能会变——人才栈已经在压缩了：以前有前端工程师、后端工程师，现在越来越全栈。

Q：你自己是 PM，你觉得 AI 时代还需要 PM 吗？

C：（笑）这是个玩笑，但我来认真回答。PM 的角色本质上是未定义的：它的目标是适配团队和业务当下的需求。在小团队里，一个强的技术领导者或一个有产品思维的设计师，其实就能完成大部分 PM 工作。你可能不需要很多人做 PM，直到团队变得很大。

但这不意味着 PM 会消失，而是说这个岗位的门槛在变高。

Q：现在 OpenAI 内部代码有多少是 Codex 生成的？

C：没有具体百分比，但我可以说绝大部分代码是 AI 写的。大部分人现在甚至不再打开 IDE 了。

这个转折点发生在 GPT-5.2 Codex（去年 12 月）：模型在长程任务、端到端处理、上下文管理和指令遵循上突然好了一个台阶。之前我们是在用 AI 做 tab 补全或结对编程，程序员还是得守在键盘前；之后我就直接"委托"任务给它了：跟它一起定计划、定规范，然后让它自己跑。

这就是为什么我们发布了 Codex App：我们想要一种委托式而非结对式的交互体验。可以同时委托多个代理，可以高效管理，符合真正的人机工效。

C：在委托模式下，针对规范和计划的审查比代码审查更重要。

我们最近上线了一个"计划模式"：agent 先跑出去，生成一个很长的计划，然后问你"你同意我这么做吗"或者"有什么要调整的"。这很像团队里新来的同事，在动手之前要向团队提交一份Request for Comments。

所以 review the plan 的能力变得极其关键——它比 review 代码本身更被低估。

至于代码审查，Codex 被专门训练过做这件事，而且效果非常好：它的批评信号噪声低，你真的可以信任它的反馈。我们几乎所有代码都会自动经过 Codex 审查。

Q：有一种声音说"企业落地 AI 必须靠 FDE（现场交付工程师）"，你不同意？

C：如果你一开始就搞大而全的 workflow 自动化，你得穿透所有安全合规障碍、对接所有数据系统，这个工程量巨大，确实需要 FDE。但代价是你严重低估了 AI 在这家公司的实际潜力。

更好的方式：把 AI 直接交到干活的人手里。 让他们同时用 AI 干活、同时被 AI 部分替代，这样他们会对 AI 形成真正的掌控力，知道这东西怎么工作、边界在哪，而不是面对一个黑盒子束手无策。

想象一下：你是一个客服专员，AI 正在自动化你部分工作，但你从来没听说过 ChatGPT，也不被允许用它。你对 AI 完全没感觉。但如果同时你自己也在用 ChatGPT 处理工作，你就感觉是被赋能而不是被替代。

OpenAI 正在构建一个浏览器内核（Browser Atlas），原因之一就是：企业里有大量工具系统目前还没有 AI 原生的 FDE 接口，但它们都在浏览器里运行。通过控制浏览器，我们可以给企业做一个安全的 agentic browsing 层，不需要任何 FDE 介入。

Q：Codex 跟 Cerebras 合作，Cerebras 是最快的推理提供商。这个合作很重要，但我认为推理不会是垄断的——竞争太激烈了，一定会有多个答案。

C：完全同意。但 GPT-5.3 Codex 模型效率确实显著提升，用户反馈它比之前快很多。除了模型本身的优化，我们在 inference 层面也做了改进：API 层面的模型服务快了 40%，Codex 端快了 25%。速度非常重要，我们从硬件和模型两个维度同时推进。

Q：你们怎么防止用户转向 Cursor 或 Claude Code？

C：我们采取了一个反直觉的策略：尽量让切换变得容易。比如我们发起并推广了 agents.md 这个开放标准，让所有代理都能读取；skills 文件夹也没有命名为 codex-skills，而是中立的 agents，这样任何代理都能用。

编程任务本身是"密封"的：代理读取 agents 文件、写好 patch 提交到 git，两端都是 vendor-neutral 的，所以迁移成本低。

但当代理开始接入更多系统（Google Docs、各种企业工具），迁移成本就高了：连接代理到一个系统本身就是一个信任决策，企业会非常慎重。这就是真正的留存点。

Q：你跟 Sam 或 Brad 汇报时，核心指标是什么？

C：活跃用户，不是收入。 我们目前用周活跃用户（WAU），但我同意 DAU 更适合——尤其当 Codex 在某种程度上正在取代 IDE 时 daily active 才是正确的衡量标准。

理想状态是：对于任何任务，你的本能反应是去问一个代理。就像现在用 Google 搜索一样自然——"我要做什么事，我就去这个文本框。"

Q：对大多数普通人来说 chat 效率太低，browser-based discovery UI 才是未来。你怎么看？

C：我的答案是肯定的，但也分两层。

第一层：对话式界面会是核心支柱。 你可以把它加进任何群聊，它就能发现怎么帮你。这类似于 Slack 当年成为信息流转中心的方式——虽然理论上在文档里评论、在正确的时间戳标注视频才是"更高效"的，但 Slack 的"我就想发个消息给你"的交互摩擦极低，人们就是会去那里。

第二层：对于深度用户，GUI（图形界面）依然重要。 就像高管助理的场景——你需要亲自翻看会议记录、自己编辑。不同场景用不同界面，chat 和专用 GUI 会配对使用。

Q：SaaS 是不是都要被颠覆了？Salesforce、ServiceNow 跌了 20-40%。

C：我认为这个反应过度了。关键问题是：这个 SaaS 公司是否拥有与终端用户的真实关系？是否拥有某个重要的"系统 of record"（数据记录系统）？ 如果拥有，这两者实际上比以往更重要。

但如果是纯"粘合层"——两边都不沾，那就危险了。客户支持（Customer Support）我是真的认为会被大幅渗透。

对于创业者来说：因为现在 building good product 变容易了，你不能只靠"我会做产品"这件事。真正稀缺的是agency（主动性）、品味和质量，以及对特定客户的深度理解。

看好的领域：涉及复杂物理基础设施的；fintech 和银行集成这种难做的金融产品——OpenAI 不太可能去和东南亚 500 家银行建立关系。

Q：如果你面对一个斯坦福、剑桥、ETH 的 CS 学生，你会说什么？

C：这是做工程师最好的时代。 你有不可思议的工具，能以前所未有的速度理解阅读大型代码库：你可以问 AI 关于代码库的几乎任何问题，让它帮你规划可能原本要研究好几天的改动。

但找工作的竞争也更激烈了。你需要展示你的品味：做出真正高质量的东西，然后分享出来。当有人给我发邮件，附上一个有意思的项目链接，这比简历更让我注意。

C：在 Dropbox 我学到最重要的一课是：做工具，必须把它当作"参与系统"来设计。 如果你的工具不能让用户觉得"这就是最简单的方式"，他们就是不会用。

Slack 就是一个例子——理论上在文档里评论更高效，但 Slack 有巨大的"引力"，人们就是想去那里聊。

现在做 Codex agents 也是同理：如果你把它们纯粹做成工作流自动化，就必须雇 Accenture 来部署 FDEs。但如果你能做出一个人们就是喜欢用的东西，哪怕只用来做部分任务——用户会越来越好、越来越深，然后你再接入更多工具和自动化。这才是正确的顺序。

C：我加入 OpenAI 时，最强的感受是：模型已经很强，但普通人完全用不上。技术能力过剩，产品没有跟上。

我最期待的是：让 AI 帮助每一个人，而不只是科技人。 具体愿景？有一天我们会在家庭 WhatsApp 里加一个代理，它自己就开始有用——不需要任何人去"配置"它，就像家里突然多了一个很会做事的人。

过去 12 个月，你最后悔没预料到什么？

我以为多模态（视频、音频）的进展会更快，以为 AI 会主要通过这些方式进入普通人生活。实际上，通过代码操控电脑的代理才是正道，多模态的进展比我预期的慢得多。

最欣赏的小竞争对手？

Amodo（来自 Source Graph 团队）的 AMP。他们的产品口碑极好，而且他们推动了 agents.md 和 agents/skills 的标准化，这对整个生态贡献巨大。

最艰难的产品决策？

之前 Codex Cloud 是"无限使用"模式，我们知道拖太久很难收回，但一直忙于更有 PMF 的产品。当我们终于改成合理限额时，遭遇了大量用户反弹——哪怕只有一小部分人觉得应该永远免费，但社交媒体上的声音影响了所有人。定价和"条款"（grandfathering）是极难的事。

五年后回看今天，什么会觉得最荒谬？

手动编辑代码、手动管理 CI/CD 和部署流程。未来会有一个完全 AI 托管的技术栈：新公司起步的方式就是去问一个 agent"帮我建一家公司"，然后不断往里加 agent。

OpenAI Codex 负责人：AI 会让程序员变少？答案与你想象的不同

相关推荐