同一天正面硬刚:Claude Opus 4.6 和 GPT‑5.3 Codex,谁先把程序员带到下一站
Anthropic 和 OpenAI 在同一天放出各自的重磅模型更新,Opus 4.6 对阵 GPT‑5.3 Codex。Greg Isenberg 拉上老朋友 Morgan Linton,做了一场几乎不加修饰的实测对比。结果不只是“谁赢了”,而是暴露了两家在 AI 编程路线上的根本差异。
Anthropic 和 OpenAI 在同一天放出各自的重磅模型更新,Opus 4.6 对阵 GPT‑5.3 Codex。Greg Isenberg 拉上老朋友 Morgan Linton,做了一场几乎不加修饰的实测对比。结果不只是“谁赢了”,而是暴露了两家在 AI 编程路线上的根本差异。
几乎同一时间,两家顶级实验室把最新前沿模型推上台面。不是发布会的喧闹,而是模型能力本身在“贴脸对打”:推理强度可控、Agent 团队、长上下文、代码一次就跑通——这次竞争,开始变得不体面也不留情。
如果你还以为AI的胜负取决于模型参数,这期TBPN会直接把你拉回现实:真正决定格局的,是算力、能源和资本意志。当Anthropic、OpenAI还在比模型,云巨头已经在用“国家级投资”下注未来。
如果你给AI完整的电脑权限,它会做什么?Peter Steinberger给出的答案有点吓人:它能修Bug、提交代码、读邮件、控灯光,甚至“黑”进你的外卖和睡眠系统。这期访谈展示的不是未来概念,而是已经在发生的生活方式迁移。
当大多数人还在给 AI 加“助手模式”,Kiran 在一场直播里做了件更激进的事:把一整个软件,直接重写成“为 Agent 而生”。这不是概念秀,而是从 CLI、工作流到代码审查的完整实战,狠狠戳中了 AI 工程的下一个瓶颈。
大多数 AI Agent 都停留在“能聊天”,而 Riley Brown 直接把 Claude Code 训练成了一个能长期记忆、自动归档、反复协作的“AI 员工”。更反直觉的是:核心不是模型多强,而是一个被严重低估的 README 工作流。
一个年收入480万美元、正在高速增长的iOS应用,被两个人用AI在32分钟内“复刻”出来,还顺手接上了真实支付。这不是标题党,而是一次把AI应用、无代码、原生订阅和App Store上架全部打通的完整演示。真正震撼的不是技术,而是门槛的坍塌。
三天前,开发者还在吹 Gemini 3 Pro;三天后,很多人已经悄悄换成了 Claude Opus 4.5。不是跑分噱头,而是真实项目、真实代码、真实 PR 的碾压级体验。这篇文章告诉你:为什么 Opus 4.5 会成为很多人眼里的“唯一主力模型”,以及它真正该怎么用。
这期《The AI Daily Brief》详细拆解了Claude Opus 4.5的真实能力边界:它不仅在多项Agent基准上刷新纪录,更重要的是把“能持续工作的AI代理”从几分钟拉长到半小时,为Vibe Coding和未来工作方式提供了现实范本。
英伟达CEO黄仁勋一句“5年内看到类人AI”,瞬间点燃整个AI圈。但如果你只盯着AGI时间表,可能会错过更关键的信号:算力正在重新分配,巨头在集体转向,AI已经开始直接影响选举,而模型本身,甚至开始“意识到”自己在被测试。