Google 连线下发布都不敢办了:Gemini 到底差 GPT‑4 多远
正在加载视频...
视频章节
原定年度最重要发布,Google 却在最后一刻取消 Gemini 的线下预览,只改成“可能上线”的线上展示。原因并不体面:模型在多语言场景下还不够稳,而外界盯着的对手,正是 GPT‑4。这不是一次普通跳票,而是一次巨头在 AI 竞赛中罕见的迟疑。
Google 连线下发布都不敢办了:Gemini 到底差 GPT‑4 多远
原定年度最重要发布,Google 却在最后一刻取消 Gemini 的线下预览,只改成“可能上线”的线上展示。原因并不体面:模型在多语言场景下还不够稳,而外界盯着的对手,正是 GPT‑4。这不是一次普通跳票,而是一次巨头在 AI 竞赛中罕见的迟疑。
一次被取消的发布会,暴露了 Google 承受的真实压力
Gemini 原本不只是一个新模型,而是 Google 十年来最关键的一次产品亮相。内部计划显示,他们甚至准备打破惯例,在感恩节到年底之间发布,只因为这场战役等不起。但结果是:加州、纽约、华盛顿的线下活动被全部叫停。
真正的导火索并不复杂——Gemini 在部分非英语场景下“还不够可靠”。这句话放在任何一家初创公司身上都不致命,但放在 Google 身上,问题就变成了:它有没有资格对标 GPT‑4?
一位了解情况的人士的评价很耐人寻味:Gemini 在某些方面已经达标,但 Google 仍在继续打磨,只因为它“必须在全球范围内可用”。这其实是一种巨头特有的焦虑——不是能不能赢,而是输不起。
为什么 Google 不能接受“差不多”,而 OpenAI 可以
对 Gemini 的要求,从一开始就不是“很好用”,而是“至少等于 GPT‑4,最好还能在几个关键点上超过”。这是一个极其残酷的目标。
原因很现实:ChatGPT 已经成了普通人嘴里的通用名词,微软正把 GPT‑4 变成 Copilot,嵌入开发、办公、搜索等高频场景。AI 不再只是模型竞赛,而是品牌、生态和分发能力的正面冲突。
Gemini 的华盛顿场活动,原本就是为政策制定者准备的——它不仅是产品展示,更是一次“我们依然是 AI 领导者”的公开宣言。而当这样的活动被取消,市场自然会解读成一句潜台词:Google 还没准备好正面宣战。
一个反直觉的数据:Bard 真的比 ChatGPT 更讨人喜欢?
就在 Gemini 延期的同时,一组数据却给 Google 挽回了一点面子。Neil Patel 团队做了一个不太“严谨但很有意思”的实验:让 ChatGPT 和 Bard 各生成 1000 篇文章,盲测读者偏好。
结果出人意料——75% 的情况下,读者更喜欢 Bard 写的内容。
当然,这里有一个致命前提没有交代清楚:用的是 GPT‑3.5 还是 GPT‑4?如果是前者,这个结论的含金量会大打折扣。但即便如此,它依然提醒了一个常被忽略的事实:模型能力 ≠ 用户体验。
在“写得顺、读得像人”这件事上,Google 并没有彻底出局。Gemini 真正要解决的,可能不是智商,而是稳定性与信任感。
当版权成为护城河:Getty 的两面下注给行业打了个样
同一期简报里,还有一条被很多人忽略却极其重要的线索:Getty Images 一边把 Stability AI 告上英国法庭,一边转头和 Runway 合作,推出“完全授权”的企业级视频模型。
这不是自相矛盾,而是一次教科书级别的商业策略——在法律不确定性被解决之前,版权本身就是最硬的壁垒。
Runway + Getty 的组合,本质是在对企业说一句话:你可以用生成式视频,但不用担心被起诉。未来,模型能力可能会趋同,但“你敢不敢用”,将成为真正的分水岭。
总结
把这些碎片拼在一起,会看到一个清晰信号:生成式 AI 已经从“谁更聪明”进入“谁更稳、谁更敢承担后果”的阶段。Google 推迟 Gemini,不是失败,而是一次极度谨慎的选择;Getty 的双线操作,则说明规则本身正在变成产品的一部分。
对从业者来说,takeaway 很现实:不要只盯着参数和榜单,多问一句——这个模型在真实场景下靠谱吗?合规成本谁来扛?未来一年,胜出的未必是最强的模型,而是最“可落地”的那一个。
关键词: Gemini, GPT-4, Google, 生成式AI, 模型发布
事实核查备注: 需核查:1)Gemini 线下活动取消的时间与地点(加州、纽约、华盛顿);2)信息来源是否为 The Information;3)Bard 与 ChatGPT 对比实验是否明确使用 GPT‑3.5 还是 GPT‑4;4)Getty Images 起诉 Stability AI 的英国法院裁定阶段;5)Runway 与 Getty 合作模型的具体名称(RGM)。