Gemini 3 没有奇迹，但谷歌正在重新变得可怕

AI PM 编辑部 · 2025年11月19日 · 12 阅读 · AI/人工智能

AI应用计算机视觉 TPU AI工具模型训练多模态代码生成 AI Agent 生成式AI AI推理

正在加载视频...

视频章节

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发，拆解为什么它不像一次“AI 奇点”，却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比，揭示了当下 AI 进步的真实形态：没有二元跃迁，只有持续堆叠，以及由此带来的产品、资本与竞争格局变化。

Gemini 3 没有奇迹，但谷歌正在重新变得可怕

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发，拆解为什么它不像一次“AI 奇点”，却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比，揭示了当下 AI 进步的真实形态：没有二元跃迁，只有持续堆叠，以及由此带来的产品、资本与竞争格局变化。

没有“终于能做到的事”，但一切都更强了

为什么 Gemini 3 的发布让人既兴奋又有点失望？因为它几乎完美地诠释了当下大模型的进化方式。主持人形容 Gemini 3 Pro 是“Google 最聪明的模型”，具备最先进的推理能力、更顺滑的 vibe coding（即与人协作写代码的体验）以及更深的多模态理解。但紧接着一句评价非常尖锐：“它就是 AI 聊天。回答问题、写点代码、做一堆很酷的事，但没有哪一项让你惊呼‘它终于能做到这个了’。”

这正是节目反复强调的核心判断：AI 并没有停滞，但也没有发生二元式能力跃迁。Gemini 3 的升级更像是 iPhone 的年度更新——每一代都更快、更稳、更好用，但不会让旧世界瞬间作废。这种“边际递减式进步”在 ARC 分数、视觉理解和网站导航能力上都能看到：指标在涨，但仍需要大量脚手架（prompt、工具、规则）才能完成复杂任务。

这一判断很重要，因为它直接影响我们如何看待 AI 的商业化节奏。节目并不否认 Gemini 3 在多模态和推理上的领先，而是提醒：不要把连续工程进步误读为“已经接近通用智能”。

幽默、诱饵和生成式 UI：模型开始“想要被用”

为了跳出基准测试的抽象讨论，主持人做了一些非常具体、甚至有点恶搞的实验。他们让 Gemini 3 生成脱口秀段子、写 X 平台的高互动帖子，结果发现模型明显偏好互动诱饵式表达，标题感和情绪钩子都很强。有人调侃说，这种写作风格几乎“天生为社交平台优化”。

更有意思的是生成式 UI 的展示。Gemini 3 被要求直接生成可交互的网页和小应用，而不是只给代码片段。节目认为这可能孕育一种新的增长飞轮：当模型不仅生成内容，还生成“可立即分享和使用的界面”，传播成本会急剧下降，甚至出现病毒式扩散。

这里的洞见不在于技术多新，而在于产品直觉的变化。AI 不再只是“帮你完成任务的工具”，而是在努力生成一个“能被立刻消费的成品”。这也是为什么主持人认为 Gemini 3 的价值，可能更多体现在应用层的可塑性，而不是单一能力的突破。

代理能力、ARC 分数与“接近人类速度”的意义

节目花了相当篇幅讨论 ARC AGI 2 分数和代理实验。ARC 是衡量模型抽象推理和泛化能力的测试体系，而 Gemini 3 的 Deepthink 版本在该测试中取得了极高分数，但代价是计算成本巨大。主持人直言，这是一个“高成本换高性能”的版本，不能简单等同于普遍可用的能力。

更接地气的是代理实验：自动售货机代理、Minecraft 构建任务，以及与 GPT-5.1 的对比。结果并非一边倒，Gemini 3 在某些执行和规划任务上表现出更好的连续性，但仍会在复杂环境中出错。这再次印证了一个判断：我们正在逼近“人类完成任务的速度和流畅度”，但不是人类的鲁棒性。

一句被反复引用的话是：“这看起来更像是工程问题，而不是魔法问题。”当模型在速度、效率和多模态输入上接近人类，剩下的差距往往来自工具整合和环境理解，而非单纯参数规模。

从 Gemini 到反重力 IDE：谷歌的反击与资本博弈

节目明确指出，Gemini 3 的意义不仅是技术，而是叙事。ChatGPT 之后，谷歌曾陷入长期舆论低谷，而现在 Gemini 3 Pro 在多项基准上超越 GPT 和 Claude，让“谷歌重新成为赢家”这句话再次变得合理。

这种反击在产品上也有体现。Google Anti-gravity（一个 agent-first 的 IDE）被认为是对传统 IDE 的一次激进挑战：强调视觉评论、代理协作和多模态输入，而不是文件和行号。主持人认为，这不是给所有开发者准备的工具，而是一次方向性试探。

最后，话题扩展到资本层面：Anthropic 与微软、英伟达达成的 3500 亿美元估值交易，被拿来与 OpenAI 的资本规模对比。结论并不复杂——这不是一家公司的竞赛，而是整个行业在比拼算力、资本和能源耐力。无论是 TPU 投入、数据中心用水争议，还是沙特的万亿美元承诺，都在说明一件事：AI 已经进入重资产时代。

总结

这期 TBPN 给出的最大价值，不是告诉你 Gemini 3 有多强，而是帮你校准预期：AI 没有减速，但进步正在变得“平凡”。真正重要的变化发生在产品形态、资本结构和应用分发方式上。对读者来说，启发在于少等奇迹，多观察这些连续、可复利的改进，它们往往才是决定胜负的力量。

关键词： Gemini 3，多模态AI， AI Agent，生成式UI， AI行业竞争

事实核查备注：视频标题与频道：Google Gemini 3 Reactions | TBPN；核心产品：Gemini 3 Pro、Gemini、ChatGPT、Claude；关键概念：ARC AGI 2、AI Agent、多模态、TPU；公司与交易：Google、Anthropic、Microsoft、NVIDIA、OpenAI，Anthropic 约 3500 亿美元估值交易；产品演示：生成脱口秀段子、X 平台帖子、可交互网页、代理实验、Google Anti-gravity IDE。

返回文章列表