草莓只是前菜:OpenAI真正的王牌,是代号Orion的新旗舰模型

AI PM 编辑部 · 2024年08月28日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人还在追问“Strawberry 到底是什么”时,OpenAI已经悄悄把真正的赌注压在了一个新名字上:Orion。这不仅是 GPT-4 的继任者,更可能决定 OpenAI 能否继续领跑生成式 AI 这场残酷竞赛。

草莓只是前菜:OpenAI真正的王牌,是代号Orion的新旗舰模型

当所有人还在追问“Strawberry 到底是什么”时,OpenAI已经悄悄把真正的赌注压在了一个新名字上:Orion。这不仅是 GPT-4 的继任者,更可能决定 OpenAI 能否继续领跑生成式 AI 这场残酷竞赛。

从“草莓表情包”到内部共识:OpenAI这次真的急了

故事要从一段看似荒诞的传闻说起。Sam Altman 被短暂罢免前后,OpenAI 内部流出一个代号为 QAR 的“推理突破”。随后它改名为 Strawberry,而 Altman 本人和 OpenAI 高管在 X(Twitter)上接连发草莓照片,把整个 AI 圈撩得心痒难耐。

问题在于:几个月过去了,爆料满天飞,但真正的产品却迟迟没出现。直到 The Information 抛出一篇有明确信源的独家报道,事情才突然“落地”。这一次不再是情绪化的暗示,而是非常具体的描述:Strawberry 能解决“没见过的数学题”、复杂编程问题、纽约时报的 Connections 文字谜题,甚至在产品营销这种高度主观的问题上,给出更成体系的推理答案。

更关键的是语气的变化。这篇报道罕见地透露出一种“时间不站在 OpenAI 这边”的紧迫感。Strawberry 不只是炫技,而是被视为一个必须尽快上线、用来“救场”的能力模块。换句话说,这是一次带着焦虑的技术推进,而不是从容的实验发布。

Strawberry 的真正使命:不是给你用,是拿去“喂”Orion

如果你以为 Strawberry 是下一个 GPT-4 级别的产品,那就低估它了。报道里最值得反复咀嚼的一句话是:OpenAI 正在用“一个大版本的 Strawberry”来生成训练 Orion 的数据。

这句话的含义非常重。它等于默认了一件事:高质量人类数据正在成为瓶颈。Scaling Laws 还在,但“可用燃料”不够了。于是,OpenAI 选择用更强的推理模型,去合成、筛选、扩展训练数据,反过来喂养下一代旗舰模型 Orion。

这让 Strawberry 的定位发生了根本变化。它更像一个“内部加速器”,而不是面向用户的明星产品。与此同时,Strawberry 也被视为未来 AI Agent 的关键组件——因为 Agent 真正的门槛,不在对话流畅度,而在连续、多步骤、可自我纠错的推理能力。

如果这个路径成立,那 Orion 并不是简单的“GPT-4.5 或 GPT-5”,而是第一代在训练阶段就大量依赖 AI 推理数据的旗舰模型。这可能会直接影响它在复杂任务、长程规划和工具调用上的表现上限。

Orion 的压力测试:对手追上来了,投资人也在看

The Information 在文中反复强调一个事实:GPT-4 已经不再“遥遥领先”。其他公司已经推出了性能大致相当的模型,而 OpenAI 的估值、收入增长预期,几乎全部押注在“下一个旗舰模型一定要再次拉开差距”这件事上。

这也是为什么 Orion 被描述为“可能决定公司命运”的模型。语气之重,在 OpenAI 的历史报道中并不常见。即便 ChatGPT 是当前最成功的生成式 AI 产品,OpenAI 仍被普遍认为在烧钱运行。一旦 Orion 的表现不够惊艳,讲故事的空间就会急剧压缩。

与此同时,竞争并不只来自模型本身。报道中特别提到:Google 已经抢先发布了可以被打断、随时切换话题的语音 AI 助手,而 OpenAI 虽然早早预告,却尚未落地。这种“先宣布、后被反超”的情况,对一家以技术领先著称的公司来说,是极其危险的信号。

换句话说,Orion 不只是技术升级,而是一场对 OpenAI 产品节奏、组织执行力和战略判断的全面压力测试。

给政府先看一眼:这不只是技术展示,而是政治动作

还有一个细节,被很多人忽略,却极具象征意义:OpenAI 已经向美国国家安全官员演示过 Strawberry。

在模型尚未发布前,就主动向政府展示能力,这在行业里并不常见。The Information 给出的解读很直白:这是在为“先进 AI = 国家安全议题”提前占位。一方面,这是在向监管者传递“我们愿意透明合作”;另一方面,也是在讨论一个更现实的问题——如何防止这些能力被外国对手获取。

放在更大的背景下看,这几乎是对 Meta 等公司开放权重路线的一次隔空对比:当你把模型完全放开,国家安全叙事就不再站在你这边。OpenAI 显然希望通过这种方式,为整个前沿模型行业争取时间,而不是被过早、过重地监管。

这也解释了为什么 Strawberry 和 Orion 的故事,听起来不只是工程进展,而更像一盘同时在技术、资本和政策层面落子的棋。

总结

如果你是 AI 从业者,这条线索值得牢牢记住:Strawberry 的价值,不在“你什么时候能用上”,而在它正在如何改变下一代模型的训练方式。Orion 很可能是第一个真正意义上“由 AI 推理喂大的旗舰模型”。

这对个人的启发也很现实——单纯堆 Prompt、堆参数的时代正在过去,推理、规划、Agent 化能力会成为新的分水岭。接下来一年,值得你持续关注的不是某个 Demo,而是:哪些产品开始体现出“长期思考”的迹象?因为那,很可能就是 Orion 们真正落地的地方。


关键词: OpenAI, Orion, Strawberry, AI推理, 大语言模型

事实核查备注: 需要核查:1)Strawberry 原始代号 QAR 的来源时间;2)The Information 报道发布时间与措辞;3)Strawberry 演示给美国国家安全官员的具体时间与参与机构;4)Google 语音 AI 助手发布节点与能力描述;5)Orion 是否为 OpenAI 内部官方代号