Gemini 3 没有奇迹,但谷歌正在重新变得可怕

AI PM 编辑部 · 2025年11月19日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发,拆解为什么它不像一次“AI 奇点”,却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比,揭示了当下 AI 进步的真实形态:没有二元跃迁,只有持续堆叠,以及由此带来的产品、资本与竞争格局变化。

Gemini 3 没有奇迹,但谷歌正在重新变得可怕

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发,拆解为什么它不像一次“AI 奇点”,却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比,揭示了当下 AI 进步的真实形态:没有二元跃迁,只有持续堆叠,以及由此带来的产品、资本与竞争格局变化。

没有“终于能做到的事”,但一切都更强了

为什么 Gemini 3 的发布让人既兴奋又有点失望?因为它几乎完美地诠释了当下大模型的进化方式。主持人形容 Gemini 3 Pro 是“Google 最聪明的模型”,具备最先进的推理能力、更顺滑的 vibe coding(即与人协作写代码的体验)以及更深的多模态理解。但紧接着一句评价非常尖锐:“它就是 AI 聊天。回答问题、写点代码、做一堆很酷的事,但没有哪一项让你惊呼‘它终于能做到这个了’。”

这正是节目反复强调的核心判断:AI 并没有停滞,但也没有发生二元式能力跃迁。Gemini 3 的升级更像是 iPhone 的年度更新——每一代都更快、更稳、更好用,但不会让旧世界瞬间作废。这种“边际递减式进步”在 ARC 分数、视觉理解和网站导航能力上都能看到:指标在涨,但仍需要大量脚手架(prompt、工具、规则)才能完成复杂任务。

这一判断很重要,因为它直接影响我们如何看待 AI 的商业化节奏。节目并不否认 Gemini 3 在多模态和推理上的领先,而是提醒:不要把连续工程进步误读为“已经接近通用智能”。

幽默、诱饵和生成式 UI:模型开始“想要被用”

为了跳出基准测试的抽象讨论,主持人做了一些非常具体、甚至有点恶搞的实验。他们让 Gemini 3 生成脱口秀段子、写 X 平台的高互动帖子,结果发现模型明显偏好互动诱饵式表达,标题感和情绪钩子都很强。有人调侃说,这种写作风格几乎“天生为社交平台优化”。

更有意思的是生成式 UI 的展示。Gemini 3 被要求直接生成可交互的网页和小应用,而不是只给代码片段。节目认为这可能孕育一种新的增长飞轮:当模型不仅生成内容,还生成“可立即分享和使用的界面”,传播成本会急剧下降,甚至出现病毒式扩散。

这里的洞见不在于技术多新,而在于产品直觉的变化。AI 不再只是“帮你完成任务的工具”,而是在努力生成一个“能被立刻消费的成品”。这也是为什么主持人认为 Gemini 3 的价值,可能更多体现在应用层的可塑性,而不是单一能力的突破。

代理能力、ARC 分数与“接近人类速度”的意义

节目花了相当篇幅讨论 ARC AGI 2 分数和代理实验。ARC 是衡量模型抽象推理和泛化能力的测试体系,而 Gemini 3 的 Deepthink 版本在该测试中取得了极高分数,但代价是计算成本巨大。主持人直言,这是一个“高成本换高性能”的版本,不能简单等同于普遍可用的能力。

更接地气的是代理实验:自动售货机代理、Minecraft 构建任务,以及与 GPT-5.1 的对比。结果并非一边倒,Gemini 3 在某些执行和规划任务上表现出更好的连续性,但仍会在复杂环境中出错。这再次印证了一个判断:我们正在逼近“人类完成任务的速度和流畅度”,但不是人类的鲁棒性。

一句被反复引用的话是:“这看起来更像是工程问题,而不是魔法问题。”当模型在速度、效率和多模态输入上接近人类,剩下的差距往往来自工具整合和环境理解,而非单纯参数规模。

从 Gemini 到反重力 IDE:谷歌的反击与资本博弈

节目明确指出,Gemini 3 的意义不仅是技术,而是叙事。ChatGPT 之后,谷歌曾陷入长期舆论低谷,而现在 Gemini 3 Pro 在多项基准上超越 GPT 和 Claude,让“谷歌重新成为赢家”这句话再次变得合理。

这种反击在产品上也有体现。Google Anti-gravity(一个 agent-first 的 IDE)被认为是对传统 IDE 的一次激进挑战:强调视觉评论、代理协作和多模态输入,而不是文件和行号。主持人认为,这不是给所有开发者准备的工具,而是一次方向性试探。

最后,话题扩展到资本层面:Anthropic 与微软、英伟达达成的 3500 亿美元估值交易,被拿来与 OpenAI 的资本规模对比。结论并不复杂——这不是一家公司的竞赛,而是整个行业在比拼算力、资本和能源耐力。无论是 TPU 投入、数据中心用水争议,还是沙特的万亿美元承诺,都在说明一件事:AI 已经进入重资产时代。

总结

这期 TBPN 给出的最大价值,不是告诉你 Gemini 3 有多强,而是帮你校准预期:AI 没有减速,但进步正在变得“平凡”。真正重要的变化发生在产品形态、资本结构和应用分发方式上。对读者来说,启发在于少等奇迹,多观察这些连续、可复利的改进,它们往往才是决定胜负的力量。


关键词: Gemini 3, 多模态AI, AI Agent, 生成式UI, AI行业竞争

事实核查备注: 视频标题与频道:Google Gemini 3 Reactions | TBPN;核心产品:Gemini 3 Pro、Gemini、ChatGPT、Claude;关键概念:ARC AGI 2、AI Agent、多模态、TPU;公司与交易:Google、Anthropic、Microsoft、NVIDIA、OpenAI,Anthropic 约 3500 亿美元估值交易;产品演示:生成脱口秀段子、X 平台帖子、可交互网页、代理实验、Google Anti-gravity IDE。