同一天正面硬刚:Claude Opus 4.6 和 GPT‑5.3 Codex,谁先把程序员带到下一站

AI PM 编辑部 · 2026年02月06日 · 13 阅读 · AI/人工智能

正在加载视频...

视频章节

Anthropic 和 OpenAI 在同一天放出各自的重磅模型更新,Opus 4.6 对阵 GPT‑5.3 Codex。Greg Isenberg 拉上老朋友 Morgan Linton,做了一场几乎不加修饰的实测对比。结果不只是“谁赢了”,而是暴露了两家在 AI 编程路线上的根本差异。

同一天正面硬刚:Claude Opus 4.6 和 GPT‑5.3 Codex,谁先把程序员带到下一站

Anthropic 和 OpenAI 在同一天放出各自的重磅模型更新,Opus 4.6 对阵 GPT‑5.3 Codex。Greg Isenberg 拉上老朋友 Morgan Linton,做了一场几乎不加修饰的实测对比。结果不只是“谁赢了”,而是暴露了两家在 AI 编程路线上的根本差异。

罕见同日发布:这不是巧合,是正面宣战

很少看到这种场面:Anthropic 刚发布 Claude Opus 4.6,OpenAI 几乎同步端出 GPT‑5.3 Codex。Greg Isenberg 在视频一开头就点破——“今天是个 massive day”。这句话的潜台词是:你现在看到的,不是常规迭代,而是两条路线的硬碰硬。

Opus 和 Codex 并不是第一次被拿来比较,但 4.6 vs 5.3 的时间点非常敏感。一边是 Anthropic 继续强化“通用推理 + 长上下文 + 稳定输出”的形象;另一边是 OpenAI 把 Codex 明确放在更偏工程化、偏 API 使用者的位置上。这场对比的价值不在参数,而在使用感:当你真的把任务丢进去,谁更像一个靠谱的搭档?

实测比参数更残酷:Opus 赢在“结果感”

Morgan Linton 在测试中反复强调一个词:end result(最终结果)。不是谁先响应、不是谁说得更复杂,而是谁更快、更稳定地把事情“做完”。

在实际操作中,Opus 4.6 给人的感觉是:它更愿意自己把链路走完整,而不是频繁把决策抛回给人类。视频里有一个很细节的瞬间——当任务跑完,Opus 没有卡在限制、额度或者奇怪的中断点上,Morgan 直接说了一句:“In this test, Opus won.”

这句话分量很重,因为它不是营销结论,而是实操后的直觉判断。相比之下,GPT‑5.3 Codex 的优势更多体现在“你知道该怎么用它”的前提下:如果你熟悉 API、懂得拆任务、会做 good housekeeping,它依然很强。但一旦你追求的是低心智负担,Opus 的完成度更讨喜。

Codex 没输在能力,输在门槛

视频里有一个容易被忽略的点:Greg 提到,对 API 用户来说,GPT‑5.3 Codex 的一系列设置和习惯,本质上是“good housekeeping”。这句话听起来轻描淡写,但其实点中了 OpenAI 当前的取舍。

Codex 并不是要做一个“什么都替你想好”的模型,而更像一个高性能引擎。前提是,你得会开。它假设用户有方法论、有工程经验,知道什么时候该限制、什么时候该放开。这对专业开发者是加分项,但对想快速验证想法的人来说,摩擦真实存在。

Opus 则更像一个默认帮你兜底的合作者。你可以方法不完美,但它会努力给你一个看起来“已经能用”的版本。这不是智力差异,而是产品哲学的差异。

真正的分水岭:你要的是工具,还是合伙人

这场对比最有价值的地方,在于它让一个老问题变得具体:我们到底希望 AI 在编程中扮演什么角色?

从视频的整体节奏看,Opus 4.6 更接近“合伙人”——它愿意承担更多决策责任,减少你来回调整的次数。而 GPT‑5.3 Codex 更像“顶级工具”——一旦你给出清晰指令,它的上限依然非常高。

Greg 和 Morgan 的对话并没有试图给出终局答案,但一个趋势已经很清楚:未来的竞争,不只是模型更聪明,而是谁能让用户更少被打断、更少思考“我是不是哪里没设对”。

总结

如果你是 AI 从业者,这场对比值得反复琢磨。它提醒我们:选择模型,不只是看能力榜单,而是看它是否契合你的工作方式。短期内,你完全可能“两边都用”——用 Codex 做高控制度的工程任务,用 Opus 快速跑想法、交付结果。更重要的是,这种同日硬刚的发布节奏,说明模型竞争已经从“谁更强”转向“谁更顺手”。下一个阶段,真正拉开差距的,可能不是参数,而是体验。


关键词: Claude Opus 4.6, GPT-5.3 Codex, Anthropic, OpenAI, AI 编程

事实核查备注: 需要核查:1)Claude Opus 4.6 与 GPT‑5.3 Codex 的正式版本名称与发布时间;2)Greg Isenberg 视频中实测结论“In this test, Opus won”的原始语境;3)视频中涉及的具体测试是否为单一案例;4)人物:Greg Isenberg、Morgan Linton、Greg Brockman 的出场与身份。