苹果每天烧掉数百万美元训AI，却依然不急着推ChatGPT

AI PM 编辑部 · 2023年09月07日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

当外界以为苹果在生成式 AI 上“慢半拍”时，一份内部报告揭示：苹果每天花数百万美元训练大模型，参数规模直逼 2000 亿。但更反直觉的是，苹果最怀疑的，恰恰是 ChatGPT 这种形态本身。

当外界以为苹果在生成式 AI 上“慢半拍”时，一份内部报告揭示：苹果每天花数百万美元训练大模型，参数规模直逼 2000 亿。但更反直觉的是，苹果最怀疑的，恰恰是 ChatGPT 这种形态本身。

过去一年，苹果几乎是生成式 AI 舆论场里的“隐形人”。没有发布会、没有模型 Demo，更没有 ChatGPT 式的产品。但 The Information 抛出的一个数字，直接改写了这个叙事：苹果每天花费数百万美元训练新一代 AI 模型。

更关键的是时间点。早在 四年前，苹果 AI 负责人 John Giannandrea 就批准组建了一个专门做大语言模型（LLM）的团队，内部代号叫 Foundational Models。这不是临时起意，而是一场长期下注。

团队规模却小得惊人：大约 16 人。在“人海战术”已经成为大模型标配的今天，苹果反其道而行——人少、钱多、周期长。这种配置本身就很苹果：不追热点，但一旦认定方向，就直接砸到基础设施层。

Foundational Models 团队的定位，并不是直接做产品，而是扮演苹果内部的“模型发动机”。这点和 Google、Meta 的基础模型团队非常相似：先造模型，再由其他产品团队接管落地。

团队负责人 Roming Pang 来自 Google，曾与 Giannandrea 共事。这条人脉线索很重要——它解释了为什么苹果在早期模型训练中，甚至会使用 Google Cloud 和 TPU。

而且，这还不是苹果唯一的 AI 赌注。报道显示，至少还有两支新团队正在并行推进：一支做视觉智能，生成图像、视频甚至 3D 场景；另一支专注 多模态 AI 的长期研究。结合 Vision Pro 的发布时间来看，这条技术路线几乎是明牌。

苹果不是没想清楚 AI 用在哪，而是把赌注压在了“模型 + 终端体验”这个更难、但一旦成功就极难复制的组合上。

真正让从业者坐不住的，是苹果内部代号 Ajax GPT 的模型细节。

多位知情人士透露：Ajax GPT 的能力被认为 超过 GPT‑3.5，训练参数规模 超过 2000 亿。这意味着什么？苹果并不是在“试水”，而是在做一线级别的大模型。

但问题随之而来，而且极具苹果特色：这个模型怎么用？

一个直接场景是 AppleCare 客服；另一个，是几乎所有人都在等的——Siri 的彻底重构。目标不再是“回答问题”，而是用自然语言自动完成复杂任务，比如一句话生成并发送 GIF。

真正的瓶颈在部署。苹果高层依然偏好 端侧运行，理由是隐私和性能。但一个 2000 亿参数的模型，显然不可能塞进 iPhone。这也是为什么，苹果迟迟没有把 Ajax GPT 推到台前：他们还没找到一个既符合隐私哲学、又能规模化的解法。

如果把苹果放进更大的行业背景，它的“慢”反而显得更理性。

Meta 的 LLaMA 团队内斗、算力争夺，直接导致 原始论文作者一半以上离职；Amazon 在 ChatGPT 发布前夕，才发现自家的 Bedrock 根本不在一个量级；AWS、Google、Microsoft 全部被 OpenAI 的节奏打乱。

一个残酷现实正在浮现：大模型竞争，本质是算力、组织和耐心的竞争。Meta 因为算力分配撕裂团队，Amazon 因为节奏判断失误被迫转向，而苹果，选择的是最不性感、但最稳的路径——少说话，多砸钱，慢集成。

Giannandrea 对聊天机器人的长期怀疑，也在这里显得意味深长：他不是不相信 LLM，而是不相信“聊天”是最终形态。直到看到内部 Demo 真正能完成任务，他才开始转变态度。

这件事对从业者最大的启发，不是“苹果要不要做 ChatGPT”，而是大模型真正的竞争力，正在从模型本身转向“如何嵌入真实产品”。苹果用每天数百万美元，买的不是热度，而是时间窗口和选择权。

如果你在做 AI 产品，现在该问的可能不是“我用哪个模型”，而是：我的产品是否真的需要一个对话框？是否有端侧、隐私、延迟这些更底层的约束？

一个大胆但并非空穴来风的预判是：当苹果真正发布 AI 能力时，它可能不会叫 Chat，也不会让你意识到那是一个 LLM——但你会发现，很多事情突然“变简单了”。

关键词： Apple AI，大语言模型， Ajax GPT， Siri 重构，生成式AI

事实核查备注：每日训练成本“数百万美元”的具体区间；Ajax GPT 参数规模与对 GPT‑3.5 的对比；Foundational Models 团队人数；Giannandrea 的内部态度变化时间线