Gemini一再延期,谷歌为什么在大模型竞赛中越等越被动

AI PM 编辑部 · 2023年11月17日 · 6 阅读 · AI/人工智能

正在加载视频...

视频章节

OpenAI Dev Day 刚用 GPT-4 Turbo 和 128K 上下文窗口点燃整个行业,转头大家却发现:那个被寄予厚望、号称能正面挑战 GPT-4 的 Google Gemini,又延期了。这不是一次普通的产品跳票,而是谷歌在 AI 时代最尴尬的一次集体等待。

Gemini一再延期,谷歌为什么在大模型竞赛中越等越被动

OpenAI Dev Day 刚用 GPT-4 Turbo 和 128K 上下文窗口点燃整个行业,转头大家却发现:那个被寄予厚望、号称能正面挑战 GPT-4 的 Google Gemini,又延期了。这不是一次普通的产品跳票,而是谷歌在 AI 时代最尴尬的一次集体等待。

所有人都在狂奔,只有谷歌在“等等再说”

11 月初的 AI 圈,节奏快到让人喘不过气。OpenAI 在 Dev Day 一天之内甩出 GPT‑4 Turbo、128K 上下文窗口、Assistants API 和 Custom GPT,明确告诉开发者:平台已经铺好,尽管来建。紧接着,微软、Meta 接连发布新进展,连亚马逊都被传正在憋大招。

就在这一天,有人发了一条极具杀伤力的推文:“Where is Google?”答案很快揭晓——Gemini 延期。

原本被认为‘就在拐角处’的 Gemini,在 11 月被确认将推迟到 2024 年 Q1。问题不只是慢了一步,而是当整个生态开始围绕 OpenAI API 生长时,谷歌缺席了最关键的一轮建平台窗口期。等待的时间越长,留给 Gemini 的容错空间就越小。

Gemini不是Bard,它被期待做一件更残酷的事

先说清楚一件事:Gemini 不是 Bard。Bard 这半年其实在持续进化——数学能力增强、面向更低年龄段开放、开始具备类似 Code Interpreter 的数据分析和可视化能力。但这些更新解决的是‘能不能用’,而不是‘能不能赢’。

Gemini 才是那个被期待正面挑战 GPT‑4 的模型。根据 The Information 9 月的报道,谷歌已经向部分外部公司开放 Gemini 测试,这通常意味着产品接近发布。更重要的是,测试者给出的评价非常具体:
- 原生多模态,而不是后期拼接
- 利用谷歌搜索、地图、YouTube 等海量自有数据
- 在理解用户意图上更准,幻觉更少
- 代码生成能力明显提升

这些描述之所以让人兴奋,是因为它们击中了 GPT‑4 目前最脆弱的几个点。但也正因为如此,Gemini 一旦上线,就不再只是‘另一个大模型’,而是要证明谷歌过去十年积累的数据和算力,真的能转化为代际优势。

算力神话拉满,延期只会把标准抬到离谱

围绕 Gemini 的期待,并不只来自产品层面。SemiAnalysis 那篇《Google Gemini Eats the World》几乎把算力叙事拉到了极致:预训练 FLOPs 超过 GPT‑4 的 5 倍,明年有望到 20 倍。这篇文章甚至引发了 Sam Altman 本人下场回应。

问题在于—— hype 一旦被拉满,延期就会变成反噬。NVIDIA 的 Jim Fan 直接把市场期待总结成了一张“几乎不可能完成的清单”:
- 文本能力达到 GPT‑4 的 120%
- 或同等性能但成本减半
- 或推理速度是 Turbo 的 2 倍
- 或在视觉、多模态、长视频上直接断代领先
- 并且 API 必须在 2024 年 Q1 交付

这里的潜台词是:如果 Gemini 只是‘差不多’,那在今天的时间点已经不够了。延期每多一个月,Gemini 就必须多赢一点,才能显得值得等待。

真正拖慢Gemini的,可能不是模型,而是谷歌自己

The Information 的判断很直接:挑战不完全在模型性能,而在组织本身。Gemini 是 Google Brain 和 DeepMind 合并后的核心项目,两支文化、流程、目标都不同的团队,要在高压下协同,本身就是一项高风险工程。

而时间成本,正在体现在业务层面。微软 Azure 云业务因为 OpenAI 模型加持,明显跑赢预期;反观谷歌,云业务增速降到 2019 年以来最低。更隐蔽、也更危险的是开发者心智的流失。

一旦开发者基于 GPT‑4、GPT‑3.5 和 OpenAI API 构建了完整产品栈,迁移成本会迅速升高,平台锁定开始形成。与此同时,ChatGPT 的使用数据又反过来强化模型效果,形成自我强化飞轮。

Sundar Pichai 的表态很克制:‘专注尽快把 Gemini 1.0 做好。’这句话本身没有问题,但在今天的竞争节奏下,它听起来更像是一种防守姿态。

总结

Gemini 的延期,表面看是一次产品节奏失误,本质却是谷歌在 AI 时代如何重新组织自己的缩影。对从业者来说,这件事至少有三个启示:第一,模型能力正在迅速商品化,真正的护城河是平台和开发者关系;第二,算力和数据可以放大优势,也会放大失误;第三,时间本身已经成为 AI 竞争中的核心变量。

如果你是开发者,现在更现实的策略不是押宝‘谁会赢到最后’,而是谁能在当下给你稳定、可扩展、能持续迭代的能力。Gemini 仍然值得期待,但它必须交付的,不只是一个强模型,而是一个足够有说服力的生态起点。


关键词: Gemini, GPT-4 Turbo, 大语言模型, 多模态, AI平台竞争

事实核查备注: 需要核查:1)Gemini 延期至 2024 年 Q1 的时间表;2)The Information 于 2023-09-14 关于 Gemini 测试的报道;3)SemiAnalysis 关于预训练 FLOPs 的具体表述;4)Jim Fan 对 Gemini 预期的原始推文;5)Google 云业务增速与 Microsoft Azure 对比的财报数据时间点