应用场景:计算机研究生,深度学习算法开发。
首先排除cursor
无法自己训练头部模型的ai工具是一条死路,cc和codex是背后的模型的原生harness,model是被这些harness在rl阶段直接调教过的,适配程度和第三方被动去适配不会是一个等级。你现在用原生ide也相当于拿到模型厂给你的打折token,这个cursor同样做不到。首先排除
cc(claude code)和codex目前难分伯仲,12月之前codex最大的问题是慢,到了二月底,目前codex即使调gpt 5.3 xhigh,速度也比opus 4.6要快了,速度上codex后来居上
cc的优点目前是可以丝滑的调用subagent开个session去执行一些分支任务,codex目前还做不到这一点
反过来codex长程能力很牛逼,目前我的最长运行记录是叫它写个红白机模拟器,连续工作时间一个小时,交付的结果是一个可运行的模拟器。这个应该远远达不到codex的上限,不过目前我还没想出来更复杂的一次性任务
https:// github.com/kaonashi-tyc /codex-nes-emulatorcodex目前(2026/2/28)的主要问题有以下:
- 没有结构化意识,喜欢生成一个一两千行的单文件项目,除非你显示的指导,它不会主动重构
- 不屑于写注释,这哥真的是一行注释不写,大概是为了节省token,但是作为人类去看他代码就很痛苦
- 不说人话,写文档容易走向抽象,各种省略和自造语
- 前端比较丑,很基础
把这些反过来,就是cc的优点
cc的缺点如下:
- 速度已经落后于codex
- 长程能力不行,容易劝导自己歇息,没有毅力
- 实际的逻辑和符号思考能力弱于codex,如果你的程序某个部分数学准确性要求高,请直接让codex写好,让cc来改都行
- 从3衍生出来的,cc的debug能力不如codex,codex是debug的小天才
综上呢,我觉得cc和codex,目前几乎就是处于完全等量齐观的水平,谁都不能把另一方压住,对特定任务有优劣,但是能力没有绝对之分。
真要说,如果你写的代码有比较追求精确性的部分,优先codex;如果你的项目前端重,而且有对于文档质量有需求,选择cc。
虽然claude从3.5开始常年霸占写代码头名,但是不得不说openai追赶速度简直惊人,后面两三个月什么展开,无法预测,个人更看好openai
claude、codex、cursor三个最好好,但是需要一些魔法才能使用。
国内可以使用opencode加code plan
或者trae也可以。
Codex 跟 Claude Code 到底哪个好?我想大家各自都有自己的判断。
但在我个人为二者都充了 200 刀的 Pro Max 会员以后,我的体感是:二者的模型能力之间,并没有本质的差异。甚至都足够惊艳,让人欣喜。
但我觉得它们真正的差别,并不是“谁更聪明”,而是:它们代表了两种完全不同的人与 AI 协作的理念。
本质上,我们不是在选择两个工具,而是在选择两种与 AI 交互的模式。
你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的工具。软件工程的开发模式,可以粗略分成两类通常来说,抽象地讲,软件工程开发的模式可以粗略分为两大类。
在这种场景下,我们自己可能对需求要做什么、最终的终态是什么,甚至过程中该如何实现它,都没有一个明确的定义。它更多是一个拍脑袋的灵机一动。当我们解决这类问题时,我们期待的一个 partner(无论是不是 AI),应该都要能:快速与我们交互,主动提问,甚至主动判断,给我们更多的信息输入,通过一系列沟通,最终确定出一个相对更结构化、信息密度更高的思维原型,来指引我们后续的执行。
另一种常见的工作模式则是一个更明确的需求。比如说产品已经给我们了相对明确的 PRD,那我们剩下要做的只是把这个项目真正转译为可以执行的代码。对于绝大多数研发而言,这种场景下要做的事情是基本完全确定的。我们此时要做的无非就是一些 dirty work:把 PRD 转化为真正写出来、可用的代码而已。
我的使用结论:Claude Code 更适合前者,Codex 更适合后者
结合我自己的使用经历来看:
Claude Code 更适用于探索性工作模式它会在你输出一些观点之后,快速给你响应,并且高频地向你发出提问,以确定它后续的方向、执行思路。
Codex 则完全相反:更适合确定性执行它会在你给完需求以后,非常认真且可靠地把需求描述执行完。这个过程会花很长的时间,但结果往往是令我们满意的。
想要更明确地拆分这两种工作模式的分野,我们不如从 3 个维度来拆:
其实这三者并不是一个非常正交的关系。一个很明显的结论是:
如果目标不清晰(高熵),就需要同步探索
如果一个目标本身并不清晰,只是我们拍出的粗糙 idea,那我们显然需要协作者能快速发问,帮我们把大脑中比较模糊的观念导出来。并且通过沟通确定:哪些思考是我们需要的,哪些是可以删除的通过这种快速的同步沟通,得出更结构化的结果。在这个流程中,AI 需要介入的部分,以及引导的主动性占比会更多。
如果需求清晰(低熵),就更适合异步执行
但如果需求本身已经相对清晰,是一个低熵的场景,那我们就不太需要它是一个很同步、事无巨细都要发问的流程。它完全可以在我们把事情说清楚之后,异步完成这个工作,从而解放我们人类自己的时间。同时我们也不需要给它太多主动发挥的空间,它只需要忠实执行我们给它的需求就可以。
用一个比方总结,如果要打一个比方的话:
Claude Code 更像坐在你隔壁工位的好朋友
你有了一些 idea 之后,它会立马打断你现在的所作所为,跟你探讨一些碎片化的想法。
Codex 更像一个忠实可靠的下属
你交代完任务需求以后,它会可靠地把事情完整办完,再通知你:我已经做好了。
每个模型都有它们自己的性格。
我们也可以顺应这种性格,在不同工作场景中选择不同工具。
以上是我在 2026 年 2 月对 Codex 和 Claude Code 这两个 AI Coding 工具的一些使用场景总结。但我相信这个领域是日新月异的,二者之间大概率在未来也会发生一些融合。不会说一个工具永远只支持一种工作流场景。
那就需要我们未来本身人类自己,有对需求使用场景的预判,从而能告诉模型它应该采用哪种工作流模式。
软件工程永远没有银弹。不可能说我们用一种模式,一条道走到黑,就能得到完美结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也会非常有限。
结合自己的需求场景,动态切换工作流模式,才是更高效率开发的必经之途。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/214733.html