模型越大越危险?一位验证专家给AI Agent泼了盆冷水
我们总以为更聪明的模型意味着更好的 Agent,但 Steven Willmott 在这场演讲里直接打脸:模型越大,可能越危险。真正的问题不是“能力够不够”,而是——你到底有没有说清楚它该做什么、不该做什么。
我们总以为更聪明的模型意味着更好的 Agent,但 Steven Willmott 在这场演讲里直接打脸:模型越大,可能越危险。真正的问题不是“能力够不够”,而是——你到底有没有说清楚它该做什么、不该做什么。
很多人以为,代码模型的上限取决于参数规模。但 Cursor 和 Fireworks 在这期播客里反复强调:真正决定 RL 效果的,是你能不能造出一个“模型没法作弊”的世界。Composer 2 的训练故事,几乎是对整个 AI 应用圈的一次提醒。
如果你还把世界模型当成“更逼真的视频生成”,那你已经落后一代了。Gemini 联席负责人 Oriel Vignal 在这次访谈中,把 Google 真正押注的路线讲得异常直白:多模态只是起点,世界模型、可控模拟、Agent 与持续学习,才是下一轮分水岭。
很多团队都在“做 AI Agent”,但 Ara Khan 在这场分享里毫不客气地指出:大多数人只是在生产 Slop。真正有价值的 Agent,不是换个框架就升级,而是要跨越四个成熟度层级,其中第三层甚至逼近强化学习系统的设计方式。
AlphaGo 曾被认为是只有顶级实验室才能复制的奇迹,但 Eric Jang 在播客里抛出一个近乎挑衅的说法:今天,一个人、几千美元算力,就能从零“重建”它。更重要的不是算力,而是那套反直觉的思想结构。
如果你一直以为“做音乐”是少数天才的专利,这段对话会直接推翻你的直觉。Suno 创始人 Mikey Shulman 在一次访谈中反复强调:技术真正改变的不是音乐风格,而是“谁有资格创作音乐”。更反直觉的是,AI 并没有让音乐变得更模板化,反而在制造前所未有的怪异与美感。
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
这是一场长达4小时的深度访谈,但真正炸场的只有一句话:AI行业已经不需要个人英雄主义。曾在Anthropic与Gemini训练模型的姚舜宇,用自己的路径、判断与犹豫,拆解了模型能力、应用创业、组织文化与个人选择的真实现状。
当所有人都在追逐大语言模型的“最终形态”时,NVIDIA 机器人负责人 Jim Fan 给出了一个反直觉答案:真正的 End Game 不在语言里,而在物理世界。一次演讲,把机器人、世界模型和 AGI 的关系彻底讲透。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。