两个顶级AI写代码正面对决，结论却让所有程序员意外

AI PM 编辑部 · 2026年02月25日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为顶级 AI 写代码工具一定能分出高下，这个视频会直接打脸。Ras Mic 花了大量真实使用时间，对比 Codex 和 Claude Code，最后却给出了一个极其反直觉的结论：不是谁更强，而是你怎么用。

如果你以为顶级 AI 写代码工具一定能分出高下，这个视频会直接打脸。Ras Mic 花了大量真实使用时间，对比 Codex 和 Claude Code，最后却给出了一个极其反直觉的结论：不是谁更强，而是你怎么用。

视频一开始就抛出一个时间对比：六个月前，大家还在纠结谁的 tab 补全更聪明；而现在，讨论已经升级成“谁能真正帮你写完一段可用的代码”。这不是模型突然变强，而是开发者的期待发生了变化。

Ras Mic 很清楚这一点，他不是在跑 benchmark，而是在模拟真实工作流：写代码、改代码、看 UI、接入工具。这也奠定了整条视频的基调——不是实验室里的胜负，而是日常开发中的手感差异。

当他把 Codex 和 Claude Code 摆在一起时，用了一个非常关键的判断："They’re just two very different models." 这句话几乎是整支视频的核心。

Codex 更像一个“工程型选手”：在 UI 选择、操作路径、以及你明确告诉它要做什么时，反馈非常直接；而 Claude Code 的优势，则更多体现在你给它一个模糊目标时，它能顺着上下文继续往前推。

这不是谁更聪明的问题，而是设计哲学的差异——一个偏执行，一个偏协作。

视频里有一个很容易被忽略，但对从业者极其重要的点：Ras Mic 单独拿出一段时间聊 UI 和 integrations。

原因很简单——当模型能力趋近时，真正拉开差距的，是你每天要点多少下鼠标、切多少次窗口、能不能顺手接进你原本就在用的工具。这也是他明确表示“我会用 Codex”的地方，因为在某些操作路径上，它更贴合他的习惯。

很多人只盯着模型参数，却忽略了这些“酷但琐碎”的东西，才是真正消耗注意力的地方。

最反直觉的一幕出现在结尾。Ras Mic 直接给出结论："I don’t think one is better than the other."

但这并不是和稀泥。他非常明确地区分了使用方式——什么时候用 Codex，什么时候用 Claude Code。他甚至坦言，自己是“非常不同地”在使用这两个工具。

这也是为什么视频最后提到：即便有大量用户“love it”，也不代表它适合所有人。真正成熟的用法，是根据任务切换模型，而不是押宝一个。

这场对比真正的价值，不在于告诉你“该选谁”，而是在提醒你：AI 写代码已经进入第二阶段——工具差异开始让位于工作流设计。如果你还在纠结哪个模型更强，不如反过来问：我最耗时间的编码环节是哪一步？

行动建议很简单：把 Codex 和 Claude Code 都放进你的工具箱，用一周时间刻意区分使用场景。你会发现，真正拉开效率差距的，从来不是模型排名，而是你是否用对了位置。下一波竞争，拼的是“会不会用”，而不是“谁最强”。

关键词： AI写代码， Codex， Claude Code，开发者工具，编程工作流

事实核查备注：需要核查：视频中提到的模型具体名称（如 GPT 5.3 Codex）、视频发布时间、作者 Ras Mic 的原话引用是否逐字准确。