在 Google DeepMind,AI Agent 最大的敌人不是模型,而是 Token
如果你以为 AI Agent 的核心难题是“模型还不够聪明”,那 Google DeepMind 会当场反驳你。在这场内部工程师的公开分享中,他们反复强调:真正把 Agent 跑到 Google 规模,最大的瓶颈是 Token、成本、配额,以及一整套几乎没人聊过的“代理操作系统”。
如果你以为 AI Agent 的核心难题是“模型还不够聪明”,那 Google DeepMind 会当场反驳你。在这场内部工程师的公开分享中,他们反复强调:真正把 Agent 跑到 Google 规模,最大的瓶颈是 Token、成本、配额,以及一整套几乎没人聊过的“代理操作系统”。
在这期 Latent Space 的对话中,DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点:开源模型的未来,不在于更大,而在于“更聪明地变小”。Gemma 4 的发布,只是表面,真正的变化发生在架构、部署方式和研究范式上。
如果你觉得 AI 的变化是“慢慢来的”,那这周可能会彻底打脸。不是某个模型发布、也不是某家公司融资,而是一种更难描述、却更真实的感觉:整个 AI 行业,集体进入了加速态。本期 AI Daily Brief,用一周的碎片拼出了一个信号极强的趋势。
当所有人都在卷向量数据库、Agent 框架和微调时,Google DeepMind 的 Paige 却在台上泼了一盆冷水:这些东西,迟早都会被模型本身吞噬。这场长达一小时的分享,不是产品发布,而是一份来自一线的行业预言。
当代码生成从每秒50个Token飙到1200个,真正的瓶颈不再是模型,而是人。Cerebras的Sarah Chieng在这场演讲中抛出一个反直觉观点:模型越快,开发者越要“慢”。否则,我们只是在用20倍的速度制造技术债。
如果你以为 Notion 的成功是一路顺风,那你就错了。在红杉这场访谈里,Ivan Zhao 几乎直说:过去三年,他不是在“管理一家成熟公司”,而是在被 AI、组织和自我推着重新当一次创始人。更反直觉的是——他发现,真正的瓶颈既不是技术,也不是资本。
Cerebras 曾经做出“世界上最快的 AI 计算机”,却多年无人问津。直到生成式 AI 爆发,它突然成为 OpenAI、AWS 争抢的对象,并走向 63 亿美元估值的 IPO。Andrew Feldman 亲口讲述:为什么速度会重塑商业模式,为什么真正的壁垒要熬 10 年。
如果你还在“手写代码”,他会直截了当地告诉你:你已经落后了。在这期播客里,Railway 的 Jake Cooper 用一连串反直觉的判断,解释了什么是 Agent-Native Cloud、为什么基础设施公司开始像模型公司一样思考,以及开发者正在被 AI 从流程中“移除”。
在这场与 Stripe 创始人 Collison 兄弟的对谈中,Nat Friedman 和 Daniel Gross 抛出了一个让人不安却真实的判断:AI 的进化并不是一条平滑上升的曲线,而是夹杂着混乱、浪费、甚至系统性失控。更重要的是,真正的分水岭不在模型参数,而在我们如何使用它们。
今年的 Google I/O,看起来像一场产品发布会,实际上却更像一次商业宣言:更强的视频模型、更快的 Gemini 3.5 Flash、更像“活物”的个人 AI Agent,但真正的猛料只有一个——Google 终于要把 AI 变成一台可持续印钞的机器。