Gemini一再延期，谷歌为什么在大模型竞赛中越等越被动

AI PM 编辑部 · 2023年11月17日 · 6 阅读 · AI/人工智能

Sundar Pichai Sam Altman 多模态预训练 AI应用上下文窗口 GPU 大语言模型生成式AI 视觉语言模型

正在加载视频...

视频章节

OpenAI Dev Day 刚用 GPT-4 Turbo 和 128K 上下文窗口点燃整个行业，转头大家却发现：那个被寄予厚望、号称能正面挑战 GPT-4 的 Google Gemini，又延期了。这不是一次普通的产品跳票，而是谷歌在 AI 时代最尴尬的一次集体等待。

Gemini一再延期，谷歌为什么在大模型竞赛中越等越被动

OpenAI Dev Day 刚用 GPT-4 Turbo 和 128K 上下文窗口点燃整个行业，转头大家却发现：那个被寄予厚望、号称能正面挑战 GPT-4 的 Google Gemini，又延期了。这不是一次普通的产品跳票，而是谷歌在 AI 时代最尴尬的一次集体等待。

所有人都在狂奔，只有谷歌在“等等再说”

11 月初的 AI 圈，节奏快到让人喘不过气。OpenAI 在 Dev Day 一天之内甩出 GPT‑4 Turbo、128K 上下文窗口、Assistants API 和 Custom GPT，明确告诉开发者：平台已经铺好，尽管来建。紧接着，微软、Meta 接连发布新进展，连亚马逊都被传正在憋大招。

就在这一天，有人发了一条极具杀伤力的推文：“Where is Google？”答案很快揭晓——Gemini 延期。

原本被认为‘就在拐角处’的 Gemini，在 11 月被确认将推迟到 2024 年 Q1。问题不只是慢了一步，而是当整个生态开始围绕 OpenAI API 生长时，谷歌缺席了最关键的一轮建平台窗口期。等待的时间越长，留给 Gemini 的容错空间就越小。

Gemini不是Bard，它被期待做一件更残酷的事

先说清楚一件事：Gemini 不是 Bard。Bard 这半年其实在持续进化——数学能力增强、面向更低年龄段开放、开始具备类似 Code Interpreter 的数据分析和可视化能力。但这些更新解决的是‘能不能用’，而不是‘能不能赢’。

Gemini 才是那个被期待正面挑战 GPT‑4 的模型。根据 The Information 9 月的报道，谷歌已经向部分外部公司开放 Gemini 测试，这通常意味着产品接近发布。更重要的是，测试者给出的评价非常具体：
- 原生多模态，而不是后期拼接
- 利用谷歌搜索、地图、YouTube 等海量自有数据
- 在理解用户意图上更准，幻觉更少
- 代码生成能力明显提升

这些描述之所以让人兴奋，是因为它们击中了 GPT‑4 目前最脆弱的几个点。但也正因为如此，Gemini 一旦上线，就不再只是‘另一个大模型’，而是要证明谷歌过去十年积累的数据和算力，真的能转化为代际优势。

算力神话拉满，延期只会把标准抬到离谱

围绕 Gemini 的期待，并不只来自产品层面。SemiAnalysis 那篇《Google Gemini Eats the World》几乎把算力叙事拉到了极致：预训练 FLOPs 超过 GPT‑4 的 5 倍，明年有望到 20 倍。这篇文章甚至引发了 Sam Altman 本人下场回应。

问题在于—— hype 一旦被拉满，延期就会变成反噬。NVIDIA 的 Jim Fan 直接把市场期待总结成了一张“几乎不可能完成的清单”：
- 文本能力达到 GPT‑4 的 120%
- 或同等性能但成本减半
- 或推理速度是 Turbo 的 2 倍
- 或在视觉、多模态、长视频上直接断代领先
- 并且 API 必须在 2024 年 Q1 交付

这里的潜台词是：如果 Gemini 只是‘差不多’，那在今天的时间点已经不够了。延期每多一个月，Gemini 就必须多赢一点，才能显得值得等待。

真正拖慢Gemini的，可能不是模型，而是谷歌自己

The Information 的判断很直接：挑战不完全在模型性能，而在组织本身。Gemini 是 Google Brain 和 DeepMind 合并后的核心项目，两支文化、流程、目标都不同的团队，要在高压下协同，本身就是一项高风险工程。

而时间成本，正在体现在业务层面。微软 Azure 云业务因为 OpenAI 模型加持，明显跑赢预期；反观谷歌，云业务增速降到 2019 年以来最低。更隐蔽、也更危险的是开发者心智的流失。

一旦开发者基于 GPT‑4、GPT‑3.5 和 OpenAI API 构建了完整产品栈，迁移成本会迅速升高，平台锁定开始形成。与此同时，ChatGPT 的使用数据又反过来强化模型效果，形成自我强化飞轮。

Sundar Pichai 的表态很克制：‘专注尽快把 Gemini 1.0 做好。’这句话本身没有问题，但在今天的竞争节奏下，它听起来更像是一种防守姿态。

总结

Gemini 的延期，表面看是一次产品节奏失误，本质却是谷歌在 AI 时代如何重新组织自己的缩影。对从业者来说，这件事至少有三个启示：第一，模型能力正在迅速商品化，真正的护城河是平台和开发者关系；第二，算力和数据可以放大优势，也会放大失误；第三，时间本身已经成为 AI 竞争中的核心变量。

如果你是开发者，现在更现实的策略不是押宝‘谁会赢到最后’，而是谁能在当下给你稳定、可扩展、能持续迭代的能力。Gemini 仍然值得期待，但它必须交付的，不只是一个强模型，而是一个足够有说服力的生态起点。

关键词： Gemini， GPT-4 Turbo，大语言模型，多模态， AI平台竞争

事实核查备注：需要核查：1）Gemini 延期至 2024 年 Q1 的时间表；2）The Information 于 2023-09-14 关于 Gemini 测试的报道；3）SemiAnalysis 关于预训练 FLOPs 的具体表述；4）Jim Fan 对 Gemini 预期的原始推文；5）Google 云业务增速与 Microsoft Azure 对比的财报数据时间点

返回文章列表