Opus 4.8被捧上神坛,但真正改变游戏规则的可能是Codex
Anthropic 刚发布 Opus 4.8,就被称为“世界最强模型”,但视频作者 Riley Brown 花了3个小时对比后,却把焦点转向了另一件事:OpenAI Codex 的更新,正在悄悄改变 AI Agent 的玩法。这不是一次简单的模型对比,而是一场关于“未来怎么用 AI”的分水岭。
Anthropic 刚发布 Opus 4.8,就被称为“世界最强模型”,但视频作者 Riley Brown 花了3个小时对比后,却把焦点转向了另一件事:OpenAI Codex 的更新,正在悄悄改变 AI Agent 的玩法。这不是一次简单的模型对比,而是一场关于“未来怎么用 AI”的分水岭。
Anthropic 刚放出 Claude Opus 4.8,第一波反馈却并非清一色的“更强了”。有人兴奋,有人挑刺,更有人直言:这不是模型升级,而是一次关于“AI该怎么用”的路线之争。更微妙的是,OpenAI、AI Agent 创业公司们,正在同一时间改写战场规则。
在 Alchemy 负责产品的 Matias Castello 不是工程师出身,却用 AI 把“个人生产力”和“团队交付速度”推到一个反直觉的新高度:事故能被提前抓住、原本一年半的项目一周完成、甚至在 Apple Watch 上用语音派发编程任务。这期 Builders Unscripted,信息密度极高。
如果你以为做 AI Agent 的难点在模型能力,这场 OpenAI Build Hour 会直接打脸你。整整一小时,OpenAI 团队反复强调:真正折磨工程团队的,是部署、生命周期和“跑着跑着不死”的现实问题,而 Agents SDK 正是为这些痛点而生。
很多人以为AI的价值在“更聪明”,但这支顶级赛车队证明:真正的胜负,藏在7秒的进站和0.1秒的决策里。OpenAI把模型从实验室推上赛道,第一次让AI直面时间、压力和不可逆的真实世界。
这不是一场关于新模型或新架构的讨论,而是一种正在改变AI公司生死线的工程模式:Forward Deployed Engineering。OpenAI、Ramp等公司在台上反复强调,它不是“支持工程师”,而是直接决定产品能否卖出去、能否活下来的关键角色。
如果你只关注模型参数,这周你可能已经落伍了:真正的变化发生在 AI Agent 层。Claude 的一系列更新、Andrej Karpathy 加盟 Anthropic、OpenAI 把 Codex 推向“超级应用”,以及 Cursor 的自动化能力,正在重新定义谁才是开发者的主战场。
这不是一期普通的科技闲聊节目。TBPN这一集,用一种近乎“战场广播”的方式,把AI IPO、SpaceX、微软内部冲突、世界博览会,以及“自动化之后”的商业真相串成了一条线索。看似杂乱,实则给了AI从业者一个极其重要的信号:旧秩序正在被清算,新估值体系正在成形。
这期 TBPN 把三条看似无关的新闻拧成了一股力:SpaceX 首次系统性披露 S-1 财务细节、Anthropic 的收入增长引发圈内侧目,以及 OpenAI 在数学能力上的“台阶式跃迁”。每一条都在重塑 AI 从业者对规模、边界与估值的判断。
当大多数人还在讨论模型能力时,Anthropic用一连串动作把话题拉回现实:挖走前OpenAI联合创始人、首次实现季度盈利、算力叙事被彻底改写。AI行业的游戏规则,可能已经换了一套。