苹果每天烧掉数百万美元训AI,却依然不急着推ChatGPT

AI PM 编辑部 · 2023年09月07日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

当外界以为苹果在生成式 AI 上“慢半拍”时,一份内部报告揭示:苹果每天花数百万美元训练大模型,参数规模直逼 2000 亿。但更反直觉的是,苹果最怀疑的,恰恰是 ChatGPT 这种形态本身。

苹果每天烧掉数百万美元训AI,却依然不急着推ChatGPT

当外界以为苹果在生成式 AI 上“慢半拍”时,一份内部报告揭示:苹果每天花数百万美元训练大模型,参数规模直逼 2000 亿。但更反直觉的是,苹果最怀疑的,恰恰是 ChatGPT 这种形态本身。

最反直觉的事实:苹果不是没下场,而是下得极深

过去一年,苹果几乎是生成式 AI 舆论场里的“隐形人”。没有发布会、没有模型 Demo,更没有 ChatGPT 式的产品。但 The Information 抛出的一个数字,直接改写了这个叙事:苹果每天花费数百万美元训练新一代 AI 模型

更关键的是时间点。早在 四年前,苹果 AI 负责人 John Giannandrea 就批准组建了一个专门做大语言模型(LLM)的团队,内部代号叫 Foundational Models。这不是临时起意,而是一场长期下注。

团队规模却小得惊人:大约 16 人。在“人海战术”已经成为大模型标配的今天,苹果反其道而行——人少、钱多、周期长。这种配置本身就很苹果:不追热点,但一旦认定方向,就直接砸到基础设施层。

一支16人的小团队,背后却是苹果的“模型中枢”

Foundational Models 团队的定位,并不是直接做产品,而是扮演苹果内部的“模型发动机”。这点和 Google、Meta 的基础模型团队非常相似:先造模型,再由其他产品团队接管落地

团队负责人 Roming Pang 来自 Google,曾与 Giannandrea 共事。这条人脉线索很重要——它解释了为什么苹果在早期模型训练中,甚至会使用 Google Cloud 和 TPU

而且,这还不是苹果唯一的 AI 赌注。报道显示,至少还有两支新团队正在并行推进:一支做视觉智能,生成图像、视频甚至 3D 场景;另一支专注 多模态 AI 的长期研究。结合 Vision Pro 的发布时间来看,这条技术路线几乎是明牌。

苹果不是没想清楚 AI 用在哪,而是把赌注压在了“模型 + 终端体验”这个更难、但一旦成功就极难复制的组合上。

Ajax GPT 曝光:参数 2000 亿,但最大难题不在模型

真正让从业者坐不住的,是苹果内部代号 Ajax GPT 的模型细节。

多位知情人士透露:Ajax GPT 的能力被认为 超过 GPT‑3.5,训练参数规模 超过 2000 亿。这意味着什么?苹果并不是在“试水”,而是在做一线级别的大模型。

但问题随之而来,而且极具苹果特色:这个模型怎么用?

一个直接场景是 AppleCare 客服;另一个,是几乎所有人都在等的——Siri 的彻底重构。目标不再是“回答问题”,而是用自然语言自动完成复杂任务,比如一句话生成并发送 GIF。

真正的瓶颈在部署。苹果高层依然偏好 端侧运行,理由是隐私和性能。但一个 2000 亿参数的模型,显然不可能塞进 iPhone。这也是为什么,苹果迟迟没有把 Ajax GPT 推到台前:他们还没找到一个既符合隐私哲学、又能规模化的解法。

当苹果犹豫时,整个行业正在为算力和人才内耗

如果把苹果放进更大的行业背景,它的“慢”反而显得更理性。

Meta 的 LLaMA 团队内斗、算力争夺,直接导致 原始论文作者一半以上离职;Amazon 在 ChatGPT 发布前夕,才发现自家的 Bedrock 根本不在一个量级;AWS、Google、Microsoft 全部被 OpenAI 的节奏打乱。

一个残酷现实正在浮现:大模型竞争,本质是算力、组织和耐心的竞争。Meta 因为算力分配撕裂团队,Amazon 因为节奏判断失误被迫转向,而苹果,选择的是最不性感、但最稳的路径——少说话,多砸钱,慢集成。

Giannandrea 对聊天机器人的长期怀疑,也在这里显得意味深长:他不是不相信 LLM,而是不相信“聊天”是最终形态。直到看到内部 Demo 真正能完成任务,他才开始转变态度。

总结

这件事对从业者最大的启发,不是“苹果要不要做 ChatGPT”,而是大模型真正的竞争力,正在从模型本身转向“如何嵌入真实产品”。苹果用每天数百万美元,买的不是热度,而是时间窗口和选择权。

如果你在做 AI 产品,现在该问的可能不是“我用哪个模型”,而是:我的产品是否真的需要一个对话框?是否有端侧、隐私、延迟这些更底层的约束?

一个大胆但并非空穴来风的预判是:当苹果真正发布 AI 能力时,它可能不会叫 Chat,也不会让你意识到那是一个 LLM——但你会发现,很多事情突然“变简单了”。


关键词: Apple AI, 大语言模型, Ajax GPT, Siri 重构, 生成式AI

事实核查备注: 每日训练成本“数百万美元”的具体区间;Ajax GPT 参数规模与对 GPT‑3.5 的对比;Foundational Models 团队人数;Giannandrea 的内部态度变化时间线