OpenAI Codex 负责人:AI 会让程序员变少?答案与你想象的不同

OpenAI Codex 负责人:AI 会让程序员变少?答案与你想象的不同Q 主持人 投资人 C Alexander Bericos OpenAI Codex 产品负责人 来源 youtube 访谈视频 Mixlab 编辑团队整理优化 OpenAI Codex 产品负责人 Alexander 在本期访谈中 从投资人 从业者与产品构建者三重视角 系统性地回答了关于 AI 编程现状与未来的关键问题 他的核心观点反直觉却有力 AI 不会消灭程序员 而是会让 amp

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



Q:主持人,投资人

C:Alexander(Bericos),OpenAI Codex 产品负责人

来源:youtube访谈视频,Mixlab 编辑团队整理优化

OpenAI Codex 产品负责人 Alexander 在本期访谈中,从投资人、从业者与产品构建者三重视角,系统性地回答了关于 AI 编程现状与未来的关键问题。他的核心观点反直觉却有力:AI 不会消灭程序员,而是会让"写代码"这件事变得基础到近乎透明 —— 真正的瓶颈是人类自己愿不愿意张嘴、愿不愿意定义任务。此外,他透露 Codex 自 GPT-5.2 以来用户量增长 20 倍,并预告未来将重新押注云端产品。

Q:你之前说过:人类打字速度和验证工作,是比模型算力或架构更关键的 AGI 瓶颈。这是什么意思?

C:让我先问你:你现在每天使用 AI 多少次?

Q:三十多次吧。

C:如果完全零成本,你认为 AI 每天能帮你多少次?

Q:我觉得应该全天候运行在所有事情上。

C:没错。现在 OpenAI 内部的工程师基本上 Codex 从不关机,甚至在开会时都开着,因为"Codex 没活干"就等于在浪费时间。但问题是:我明知 AI 能帮我做所有事,我却懒得打那么多 prompt,也想不出所有它能帮我的场景。所以我每天用 AI 的次数和你差不多。

我认为 AI 应该每天帮助我们成千上万次,但人类的输入成本太高了。 大多数人不可能为了用好 AGI 而去学怎么写 prompt。真正理想的世界里,你不需要想"AI 能帮我什么",它就是知道你的上下文,然后适时出现。

C:如果形象地描述,我认为有三阶段:

第一阶段,让 AI 代理先把软件工程和编程做好,因为 LLM 本身就很擅长编程。

第二阶段,让 AI 代理能操作电脑:毕竟编程是 AI 操作电脑最好的方式。然后让所有有好奇心、愿意探索的人都能用上这些工具。

第三阶段,等我们看清什么模式有效了,再做高度产品化的事情,让用户开箱即用。

我们正在加速这个全过程。

Q:Elon Musk 说编程是第一批被大规模自动化的职业,你同意吗?

C:我同意编程是 LLM 最先擅长的领域之一。但"自动化"这个词太重了。举一个例子,我们现在不写汇编了,转向了高级语言,你会说"编程被自动化了"吗?显然不是。我们只是能写多得多得多的代码,结果反而需要更多软件工程师。

历史上也是如此:computer 这个词最初指的是人:在 Bletchley Park 帮 Enigma 机器打孔卡的人。第一代电子表格软件的设计逻辑,其实就是把人组织成网格、做表格计算再往下传递。那些具体任务都被自动化了,但每一次自动化都带来了需求的爆发,反而需要更多人。

所以 5 年后程序员会更多,不会更少。 只不过"程序员"的定义可能会变——人才栈已经在压缩了:以前有前端工程师、后端工程师,现在越来越全栈。

Q:你自己是 PM,你觉得 AI 时代还需要 PM 吗?

C:(笑)这是个玩笑,但我来认真回答。PM 的角色本质上是未定义的:它的目标是适配团队和业务当下的需求。在小团队里,一个强的技术领导者或一个有产品思维的设计师,其实就能完成大部分 PM 工作。你可能不需要很多人做 PM,直到团队变得很大。

但这不意味着 PM 会消失,而是说这个岗位的门槛在变高。

Q:现在 OpenAI 内部代码有多少是 Codex 生成的?

C:没有具体百分比,但我可以说绝大部分代码是 AI 写的。大部分人现在甚至不再打开 IDE 了。

这个转折点发生在 GPT-5.2 Codex(去年 12 月):模型在长程任务、端到端处理、上下文管理和指令遵循上突然好了一个台阶。之前我们是在用 AI 做 tab 补全或结对编程,程序员还是得守在键盘前;之后我就直接"委托"任务给它了:跟它一起定计划、定规范,然后让它自己跑。

这就是为什么我们发布了 Codex App:我们想要一种委托式而非结对式的交互体验。可以同时委托多个代理,可以高效管理,符合真正的人机工效。

C:在委托模式下,针对规范和计划的审查比代码审查更重要。

我们最近上线了一个"计划模式":agent 先跑出去,生成一个很长的计划,然后问你"你同意我这么做吗"或者"有什么要调整的"。这很像团队里新来的同事,在动手之前要向团队提交一份Request for Comments。

所以 review the plan 的能力变得极其关键——它比 review 代码本身更被低估。

至于代码审查,Codex 被专门训练过做这件事,而且效果非常好:它的批评信号噪声低,你真的可以信任它的反馈。我们几乎所有代码都会自动经过 Codex 审查。

Q:有一种声音说"企业落地 AI 必须靠 FDE(现场交付工程师)",你不同意?

C:如果你一开始就搞大而全的 workflow 自动化,你得穿透所有安全合规障碍、对接所有数据系统,这个工程量巨大,确实需要 FDE。但代价是你严重低估了 AI 在这家公司的实际潜力

更好的方式:把 AI 直接交到干活的人手里。 让他们同时用 AI 干活、同时被 AI 部分替代,这样他们会对 AI 形成真正的掌控力,知道这东西怎么工作、边界在哪,而不是面对一个黑盒子束手无策。

想象一下:你是一个客服专员,AI 正在自动化你部分工作,但你从来没听说过 ChatGPT,也不被允许用它。你对 AI 完全没感觉。但如果同时你自己也在用 ChatGPT 处理工作,你就感觉是被赋能而不是被替代

OpenAI 正在构建一个浏览器内核(Browser Atlas),原因之一就是:企业里有大量工具系统目前还没有 AI 原生的 FDE 接口,但它们都在浏览器里运行。通过控制浏览器,我们可以给企业做一个安全的 agentic browsing 层,不需要任何 FDE 介入。

Q:Codex 跟 Cerebras 合作,Cerebras 是最快的推理提供商。这个合作很重要,但我认为推理不会是垄断的——竞争太激烈了,一定会有多个答案。

C:完全同意。但 GPT-5.3 Codex 模型效率确实显著提升,用户反馈它比之前快很多。除了模型本身的优化,我们在 inference 层面也做了改进:API 层面的模型服务快了 40%,Codex 端快了 25%。速度非常重要,我们从硬件和模型两个维度同时推进。

Q:你们怎么防止用户转向 Cursor 或 Claude Code?

C:我们采取了一个反直觉的策略:尽量让切换变得容易。比如我们发起并推广了 agents.md 这个开放标准,让所有代理都能读取;skills 文件夹也没有命名为 codex-skills,而是中立的 agents,这样任何代理都能用。

编程任务本身是"密封"的:代理读取 agents 文件、写好 patch 提交到 git,两端都是 vendor-neutral 的,所以迁移成本低。

但当代理开始接入更多系统(Google Docs、各种企业工具),迁移成本就高了:连接代理到一个系统本身就是一个信任决策,企业会非常慎重。这就是真正的留存点。

Q:你跟 Sam 或 Brad 汇报时,核心指标是什么?

C:活跃用户,不是收入。 我们目前用周活跃用户(WAU),但我同意 DAU 更适合——尤其当 Codex 在某种程度上正在取代 IDE 时 daily active 才是正确的衡量标准。

理想状态是:对于任何任务,你的本能反应是去问一个代理。就像现在用 Google 搜索一样自然——"我要做什么事,我就去这个文本框。"

Q:对大多数普通人来说 chat 效率太低,browser-based discovery UI 才是未来。你怎么看?

C:我的答案是肯定的,但也分两层。

第一层:对话式界面会是核心支柱。 你可以把它加进任何群聊,它就能发现怎么帮你。这类似于 Slack 当年成为信息流转中心的方式——虽然理论上在文档里评论、在正确的时间戳标注视频才是"更高效"的,但 Slack 的"我就想发个消息给你"的交互摩擦极低,人们就是会去那里。

第二层:对于深度用户,GUI(图形界面)依然重要。 就像高管助理的场景——你需要亲自翻看会议记录、自己编辑。不同场景用不同界面,chat 和专用 GUI 会配对使用。

Q:SaaS 是不是都要被颠覆了?Salesforce、ServiceNow 跌了 20-40%。

C:我认为这个反应过度了。关键问题是:这个 SaaS 公司是否拥有与终端用户的真实关系?是否拥有某个重要的"系统 of record"(数据记录系统)? 如果拥有,这两者实际上比以往更重要。

但如果是纯"粘合层"——两边都不沾,那就危险了。客户支持(Customer Support)我是真的认为会被大幅渗透。

对于创业者来说:因为现在 building good product 变容易了,你不能只靠"我会做产品"这件事。真正稀缺的是agency(主动性)、品味和质量,以及对特定客户的深度理解。

看好的领域:涉及复杂物理基础设施的;fintech 和银行集成这种难做的金融产品——OpenAI 不太可能去和东南亚 500 家银行建立关系。

Q:如果你面对一个斯坦福、剑桥、ETH 的 CS 学生,你会说什么?

C:这是做工程师最好的时代。 你有不可思议的工具,能以前所未有的速度理解阅读大型代码库:你可以问 AI 关于代码库的几乎任何问题,让它帮你规划可能原本要研究好几天的改动。

但找工作的竞争也更激烈了。你需要展示你的品味:做出真正高质量的东西,然后分享出来。当有人给我发邮件,附上一个有意思的项目链接,这比简历更让我注意。

C:在 Dropbox 我学到最重要的一课是:做工具,必须把它当作"参与系统"来设计。 如果你的工具不能让用户觉得"这就是最简单的方式",他们就是不会用。

Slack 就是一个例子——理论上在文档里评论更高效,但 Slack 有巨大的"引力",人们就是想去那里聊。

现在做 Codex agents 也是同理:如果你把它们纯粹做成工作流自动化,就必须雇 Accenture 来部署 FDEs。但如果你能做出一个人们就是喜欢用的东西,哪怕只用来做部分任务——用户会越来越好、越来越深,然后你再接入更多工具和自动化。这才是正确的顺序。

C:我加入 OpenAI 时,最强的感受是:模型已经很强,但普通人完全用不上。技术能力过剩,产品没有跟上。

我最期待的是:让 AI 帮助每一个人,而不只是科技人。 具体愿景?有一天我们会在家庭 WhatsApp 里加一个代理,它自己就开始有用——不需要任何人去"配置"它,就像家里突然多了一个很会做事的人。

过去 12 个月,你最后悔没预料到什么?

我以为多模态(视频、音频)的进展会更快,以为 AI 会主要通过这些方式进入普通人生活。实际上,通过代码操控电脑的代理才是正道,多模态的进展比我预期的慢得多。

最欣赏的小竞争对手?

Amodo(来自 Source Graph 团队)的 AMP。他们的产品口碑极好,而且他们推动了 agents.mdagents/skills 的标准化,这对整个生态贡献巨大。

最艰难的产品决策?

之前 Codex Cloud 是"无限使用"模式,我们知道拖太久很难收回,但一直忙于更有 PMF 的产品。当我们终于改成合理限额时,遭遇了大量用户反弹——哪怕只有一小部分人觉得应该永远免费,但社交媒体上的声音影响了所有人。定价和"条款"(grandfathering)是极难的事。

五年后回看今天,什么会觉得最荒谬?

手动编辑代码、手动管理 CI/CD 和部署流程。未来会有一个完全 AI 托管的技术栈:新公司起步的方式就是去问一个 agent"帮我建一家公司",然后不断往里加 agent。

小讯
上一篇 2026-04-12 11:32
下一篇 2026-04-12 11:30

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/256101.html