两个顶级AI写代码正面对决,结论却让所有程序员意外

AI PM 编辑部 · 2026年02月25日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为顶级 AI 写代码工具一定能分出高下,这个视频会直接打脸。Ras Mic 花了大量真实使用时间,对比 Codex 和 Claude Code,最后却给出了一个极其反直觉的结论:不是谁更强,而是你怎么用。

两个顶级AI写代码正面对决,结论却让所有程序员意外

如果你以为顶级 AI 写代码工具一定能分出高下,这个视频会直接打脸。Ras Mic 花了大量真实使用时间,对比 Codex 和 Claude Code,最后却给出了一个极其反直觉的结论:不是谁更强,而是你怎么用。

从“自动补全之争”到全面对抗,战场早就变了

视频一开始就抛出一个时间对比:六个月前,大家还在纠结谁的 tab 补全更聪明;而现在,讨论已经升级成“谁能真正帮你写完一段可用的代码”。这不是模型突然变强,而是开发者的期待发生了变化。

Ras Mic 很清楚这一点,他不是在跑 benchmark,而是在模拟真实工作流:写代码、改代码、看 UI、接入工具。这也奠定了整条视频的基调——不是实验室里的胜负,而是日常开发中的手感差异。

模型不是一个物种:同样写代码,性格完全不同

当他把 Codex 和 Claude Code 摆在一起时,用了一个非常关键的判断:"They’re just two very different models." 这句话几乎是整支视频的核心。

Codex 更像一个“工程型选手”:在 UI 选择、操作路径、以及你明确告诉它要做什么时,反馈非常直接;而 Claude Code 的优势,则更多体现在你给它一个模糊目标时,它能顺着上下文继续往前推。

这不是谁更聪明的问题,而是设计哲学的差异——一个偏执行,一个偏协作。

UI、集成和工作流,才是决定体验的隐形变量

视频里有一个很容易被忽略,但对从业者极其重要的点:Ras Mic 单独拿出一段时间聊 UI 和 integrations。

原因很简单——当模型能力趋近时,真正拉开差距的,是你每天要点多少下鼠标、切多少次窗口、能不能顺手接进你原本就在用的工具。这也是他明确表示“我会用 Codex”的地方,因为在某些操作路径上,它更贴合他的习惯。

很多人只盯着模型参数,却忽略了这些“酷但琐碎”的东西,才是真正消耗注意力的地方。

最终裁决:没有赢家,只有使用场景

最反直觉的一幕出现在结尾。Ras Mic 直接给出结论:"I don’t think one is better than the other."

但这并不是和稀泥。他非常明确地区分了使用方式——什么时候用 Codex,什么时候用 Claude Code。他甚至坦言,自己是“非常不同地”在使用这两个工具。

这也是为什么视频最后提到:即便有大量用户“love it”,也不代表它适合所有人。真正成熟的用法,是根据任务切换模型,而不是押宝一个。

总结

这场对比真正的价值,不在于告诉你“该选谁”,而是在提醒你:AI 写代码已经进入第二阶段——工具差异开始让位于工作流设计。如果你还在纠结哪个模型更强,不如反过来问:我最耗时间的编码环节是哪一步?

行动建议很简单:把 Codex 和 Claude Code 都放进你的工具箱,用一周时间刻意区分使用场景。你会发现,真正拉开效率差距的,从来不是模型排名,而是你是否用对了位置。下一波竞争,拼的是“会不会用”,而不是“谁最强”。


关键词: AI写代码, Codex, Claude Code, 开发者工具, 编程工作流

事实核查备注: 需要核查:视频中提到的模型具体名称(如 GPT 5.3 Codex)、视频发布时间、作者 Ras Mic 的原话引用是否逐字准确。