最近 Codex 真的火出圈了——便宜、大碗、不限速,再加上 Claude 那边封号限速一波接一波,大家纷纷跑路换阵地。
推特上粉丝最高的vibe coding博主Riley Brown刚出了一条一个多小时的 Codex 入门深度讲解,信息密度拉满。
我把整条视频里最有价值的部分全部提炼了出来,这一篇看完,省你 103 分钟。
OpenAI 发布的桌面 Agent —— Codex。它不只是写代码,而是能同时在你的电脑上独立操作六件事:生成设计、搭建数据库、开发移动应用、录制动画、上线落地页。
这篇文章把一个 103 分钟的完整教程浓缩成五个核心部分,让你真正看懂 Codex 的工作方式和边界。
Codex 桌面版的核心定位不是聊天机器人,而是一个可以直接操作你电脑的 Agent。打开应用后,左边是所有对话,右边是一个可实时查看的预览面板——你可以看到 Agent 正在操作哪个文件、写了哪段代码、点击了哪个按钮。
每个任务都以「Project(项目)」为单位组织。创建项目时需要指定三样东西:项目名称、文件路径、以及权限级别。权限分为三档:只读、允许修改文件、允许执行命令。项目之下是一条条Chat(对话),所有产生的文件都会归档在该项目的文件夹里,方便随时回溯。
Codex 最强大的一点是:它运行时,你仍然可以继续在这台电脑上做别的事。Agent 在后台工作,你随时回来查看进度。
对话还支持Fork(分叉)——如果想基于某个中间状态尝试另一条思路,不需要新建项目,直接从当前对话 fork 一份出来,两条路径独立发展。这是传统 Cursor、VS Code 插件做不到的原生能力。
视频 07:00 截图 · Codex 桌面界面与 Project 结构
Codex 的能力边界是通过两种机制不断外延的:Plugin(插件)和Skill(技能)。
Plugin可以理解成「连接器」——把 Gmail、Google Calendar、Figma、Notion 这些第三方服务接进来,Codex 就能直接读写它们。比如开启 Gmail 插件后,直接说「发一封邮件给某某」,Agent 就会自己调用 Gmail API 完成发送。
Skill则是更灵活的可复用 Prompt 模板。任何你反复在用的工作流,都可以封装成一个 Skill。视频里演示了作者自己创建的几个 Skill:YouTube Researcher(抓取视频转写并总结)、Paper Designer(调用 Paper MCP 生成无背景设计图)、Word Doc(生成标准格式 Word 文档)。使用时只要打 /skillname 就能调用。
Plugin 是连接外部服务,Skill 是复用你自己的工作流。两者结合,一个 Agent 就能覆盖你 80% 的重复劳动。
更进一步,还可以创建Automation(自动化)——把多个 Skill 串起来定时执行。视频里作者设置了「每周自动抓取 YouTube 频道新视频 + 生成报告 + 发送到邮箱」的自动化,完全不需要人工介入。
视频 19:00 截图 · Plugin 与 Skill 演示
教程的精华在第二部分——作者扮演一位独立创业者,要在一个下午同时推进六个任务:一个移动 App、一个落地页、一段宣传动画、一个数据库、一套设计稿、一个 TestFlight 发布流程。
工作方式是这样的:每个任务开一个独立的 Chat,分别跑在不同 Agent 实例上。作者先用 Paper Designer Skill 生成无背景的 App 截图,再把设计稿交给另一个 Agent 用 Swift + Xcode 开发 iOS 原生应用。
关键操作技巧:
- 截图沟通
:直接把 Figma 框选截图扔给 Codex,告诉它「修改这个区域」,比描述快十倍
- 多任务切换
:一个 Agent 跑着 Swift 编译(几分钟),立刻切到另一个对话推进落地页
- Prompt 里引用 Skill
:例如
请用 /youtube-researcher 调研这个视频,然后用 /word-doc 生成报告
未来的生产力不是一个人用一个 AI,而是一个人同时调度多个 AI Agent 并行工作。这就是「多任务编排」的意义。
视频 44:00 截图 · 多任务并行的设计与开发
移动 App 的 UI 做好后,第二个难点是数据层。作者让 Agent 推荐数据库方案,Agent 分析需求后给出Supabase(基于 Postgres)的方案,并直接生成了建表语句和 OAuth 集成代码。
Supabase Native Google OAuth 是整个流程里最省事的一环——Agent 自己去 Supabase 控制台指引操作,连哪里点哪个按钮都列得清清楚楚。登录流程从零搭起到跑通,只花了约 20 分钟。
与此同时,落地页用 Claude Code 搭建,通过 Tally 集成表单。作者特别强调了一个细节:
不要依赖 AI 的默认样式能力,一定要给参考图。让 Agent 去看「Apple 官网」「Linear 官网」这种高质量设计,再仿照风格做。直接说「做个好看的落地页」会得到一个 2010 年审美的结果。
宣传动画则用 Remotion(React 做视频的框架)生成。复制按钮点击动画、iPhone Mockup 飘入、文字依次出现——这些过去需要 After Effects 做一天的效果,Agent 在对话里几轮迭代就能完成。
视频 64:00 截图 · Supabase + Xcode 真机构建
所有模块完成后,作者直接告诉 Agent:「请帮我准备 TestFlight 发布」。Agent 自动处理了证书配置、Bundle ID、版本号、图标切图、截图生成——这些过去让开发者头疼三天的琐事,现在是一个 Prompt 的事。
视频结尾作者还展示了一个商业化思路:把自己创建的 Skill 发布到公开市场。别人订阅你的 Skill,每次调用你都能获得分成。这本质上是在把工作流产品化——你积累的 Prompt 经验不再只是个人资产,而是可以规模化变现的数字产品。
过去的开发者卖代码、卖 App;未来的开发者卖 Skill、卖 Agent 工作流。门槛更低,边际成本为零。
整个教程的最大启示不是 Codex 有多强,而是:
- Agent 操作电脑
已经从 Demo 阶段走到可用阶段
-
真正的生产力提升来自 同时调度多个 Agent ,而不是和单个 AI 聊天
- Skill + Automation
让每个人都能把自己的工作流变成可复用的资产
如果你还没体验过桌面 Agent,现在是最好的时机——因为后面的技术迭代只会让体验越来越好,但用 Agent 的思维习惯需要现在开始培养。
视频 89:00 截图 · TestFlight 发布准备
OpenAI Codex 不是下一个代码编辑器,它是「Agent-First 电脑」的雏形。我们用电脑的方式正在被彻底重写:从逐个操作应用,到同时调度多个 Agent 帮你干活。这篇文章只是一个总览,真正的价值在于你打开 Codex 亲自跑一遍——任何一个你嫌麻烦的重复工作,都可以封装成 Skill,让 Agent 替你做一辈子。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/279056.html