模型越大越危险?一位验证专家给AI Agent泼了盆冷水
我们总以为更聪明的模型意味着更好的 Agent,但 Steven Willmott 在这场演讲里直接打脸:模型越大,可能越危险。真正的问题不是“能力够不够”,而是——你到底有没有说清楚它该做什么、不该做什么。
我们总以为更聪明的模型意味着更好的 Agent,但 Steven Willmott 在这场演讲里直接打脸:模型越大,可能越危险。真正的问题不是“能力够不够”,而是——你到底有没有说清楚它该做什么、不该做什么。
如果你还默认“GenAI 和 AI Agent 天然属于数据科学家”,这支视频会让你停下来重新想一遍。Braintrust 的 Phil Hetzel 用大量一线观察,拆穿了一个行业惯性认知:真正决定 Agent 成败的,可能根本不是模型能力,而是离问题有多近。
如果你还把 Coding Agent 当成“写业务代码的高级补全”,Ben Burtenshaw 会告诉你:这正是 AI 工程最危险的误解。来自 Hugging Face 的这场演讲,直接把 Coding Agent 拉进了 CUDA、系统架构和 ML 工程的深水区。
如果你以为 Physical AI 只是“自动驾驶的另一个名字”,这期播客会直接打脸。Applied Intuition 把今天的物理世界,比作 Android 和 iOS 出现之前的手机市场——混乱、割裂、每家都在重复造轮子。而他们正在做的,是一个覆盖空、地、海的“自治操作系统”,而且几乎不允许出错。
当所有人还在讨论ChatGPT能不能写邮件时,她已经在做“会自己行动的CRM”。OpenAI最新一期 Builders Unscripted,请来了 Hearth AI 创始人 Ashe Magalhaes——一位比风口早两年的 builder。她讲清楚了一件事:真正难的不是模型能力,而是如何在不确定性中,把AI变成一个“可靠的合作者”。
如果你以为AI的未来只是“更大的模型+更多算力”,那这期对话会让你彻底不安。ARC基准创始人François Chollet直言:AGI可能在2030年前出现,但它未必来自今天这条深度学习主干道。更重要的是,他已经在亲手搭一条“完全不同的路”。
当 AlphaFold 几乎“终结”蛋白结构预测,很多人以为材料科学的 AlphaFold 也只是时间问题。但 Heather Kulik 在 Latent Space 的这次对话里,几乎是当头一盆冷水:材料世界,远比你想的复杂,甚至可能根本等不到那个“万能模型”。
一个AI研究者,为了救自己的狗,用GPT参与设计了一种定制mRNA疫苗,肿瘤缩小、生活质量改善,也引爆了监管、伦理与技术边界的激烈争论。这不是鸡汤故事,而是一面照妖镜。
很多人以为AI的风险来自某个“突然觉醒”的时刻,但Joel Becker在这期Latent Space里反复强调:真正危险的,是我们正在系统性低估一种缓慢却指数级上升的能力曲线。METR不是在预测科幻,而是在量化我们已经看不清的现实。
一年前,很多人断言“谷歌在AI竞赛中已经出局”。但MatX CEO、前Google TPU架构师 Reiner Pope 给出了完全相反的答案:今天AI算力格局的关键,恰恰来自谷歌十年前那些看似笨拙、过早、甚至被低估的决定。这是一场关于芯片、Transformer和‘机械同理心’的硬核复盘。