两个顶级AI写代码正面对决,结论却让所有程序员意外
正在加载视频...
视频章节
如果你以为顶级 AI 写代码工具一定能分出高下,这个视频会直接打脸。Ras Mic 花了大量真实使用时间,对比 Codex 和 Claude Code,最后却给出了一个极其反直觉的结论:不是谁更强,而是你怎么用。
两个顶级AI写代码正面对决,结论却让所有程序员意外
如果你以为顶级 AI 写代码工具一定能分出高下,这个视频会直接打脸。Ras Mic 花了大量真实使用时间,对比 Codex 和 Claude Code,最后却给出了一个极其反直觉的结论:不是谁更强,而是你怎么用。
从“自动补全之争”到全面对抗,战场早就变了
视频一开始就抛出一个时间对比:六个月前,大家还在纠结谁的 tab 补全更聪明;而现在,讨论已经升级成“谁能真正帮你写完一段可用的代码”。这不是模型突然变强,而是开发者的期待发生了变化。
Ras Mic 很清楚这一点,他不是在跑 benchmark,而是在模拟真实工作流:写代码、改代码、看 UI、接入工具。这也奠定了整条视频的基调——不是实验室里的胜负,而是日常开发中的手感差异。
模型不是一个物种:同样写代码,性格完全不同
当他把 Codex 和 Claude Code 摆在一起时,用了一个非常关键的判断:"They’re just two very different models." 这句话几乎是整支视频的核心。
Codex 更像一个“工程型选手”:在 UI 选择、操作路径、以及你明确告诉它要做什么时,反馈非常直接;而 Claude Code 的优势,则更多体现在你给它一个模糊目标时,它能顺着上下文继续往前推。
这不是谁更聪明的问题,而是设计哲学的差异——一个偏执行,一个偏协作。
UI、集成和工作流,才是决定体验的隐形变量
视频里有一个很容易被忽略,但对从业者极其重要的点:Ras Mic 单独拿出一段时间聊 UI 和 integrations。
原因很简单——当模型能力趋近时,真正拉开差距的,是你每天要点多少下鼠标、切多少次窗口、能不能顺手接进你原本就在用的工具。这也是他明确表示“我会用 Codex”的地方,因为在某些操作路径上,它更贴合他的习惯。
很多人只盯着模型参数,却忽略了这些“酷但琐碎”的东西,才是真正消耗注意力的地方。
最终裁决:没有赢家,只有使用场景
最反直觉的一幕出现在结尾。Ras Mic 直接给出结论:"I don’t think one is better than the other."
但这并不是和稀泥。他非常明确地区分了使用方式——什么时候用 Codex,什么时候用 Claude Code。他甚至坦言,自己是“非常不同地”在使用这两个工具。
这也是为什么视频最后提到:即便有大量用户“love it”,也不代表它适合所有人。真正成熟的用法,是根据任务切换模型,而不是押宝一个。
总结
这场对比真正的价值,不在于告诉你“该选谁”,而是在提醒你:AI 写代码已经进入第二阶段——工具差异开始让位于工作流设计。如果你还在纠结哪个模型更强,不如反过来问:我最耗时间的编码环节是哪一步?
行动建议很简单:把 Codex 和 Claude Code 都放进你的工具箱,用一周时间刻意区分使用场景。你会发现,真正拉开效率差距的,从来不是模型排名,而是你是否用对了位置。下一波竞争,拼的是“会不会用”,而不是“谁最强”。
关键词: AI写代码, Codex, Claude Code, 开发者工具, 编程工作流
事实核查备注: 需要核查:视频中提到的模型具体名称(如 GPT 5.3 Codex)、视频发布时间、作者 Ras Mic 的原话引用是否逐字准确。