LeCun直言:LLM已到天花板,下一代AI不是更大的模型
如果你还在等“更大参数的LLM=更聪明的AI”,这期对话可能会让你停下来重想一遍。Yann LeCun在访谈中毫不客气地指出:大语言模型正在撞墙,真正的突破来自“世界模型”。更激进的是,他判断这个转折点会在2027年前变得无法忽视。
如果你还在等“更大参数的LLM=更聪明的AI”,这期对话可能会让你停下来重想一遍。Yann LeCun在访谈中毫不客气地指出:大语言模型正在撞墙,真正的突破来自“世界模型”。更激进的是,他判断这个转折点会在2027年前变得无法忽视。
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
Laurie Voss 在这场演讲里抛出一个让很多工程师不舒服的事实:真正决定 AI Agent 能不能上线的,从来不是模型有多强,而是你有没有一套“能发现失败”的评估体系。这不是学术 talk,而是一条从 demo 到 production 的血路。
把大语言模型塞进国际象棋里,当教练而不是棋手,听起来很合理。但这场分享最狠的地方在于:LLM 最大的问题不是不懂棋,而是“太会解释”,却经常解释错。Play Magnus 团队用一整套 pipeline、agents 和 evals,才勉强把它拉回现实。
当 Hugo Santos 在台上说出“CI/CD is dead”时,台下先是笑声,然后是沉默。因为所有人都隐约感觉到:这可能不是危言耸听,而是正在发生的现实。这场来自 AI Engineer 的演讲,给出了一个刺眼但极具说服力的判断——不是 CI 不重要了,而是 Agent 规模的软件,已经把我们熟悉的 CI/CD 架构彻底撞穿。
OpenAI 刚刚把 Codex 从“会写代码的助手”,升级成“会用你电脑的同事”。它不抢鼠标、不录屏,却能同时操作多个应用,甚至比人类更快。这不是炫技,而是工作方式的分水岭。
几乎所有公司都在做 GenAI,但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案:问题不在模型、不在算力,而在你没用强化学习。
如果你的 AI 还在用一套固定 Benchmark 证明“我很强”,那你已经落后了。Comet ML 的 Vincent Koc 在这场演讲里抛出一个让全场不安的判断:不是模型不够好,而是我们评测 AI 的方式,已经跟不上它进化的速度。
大多数 AI Agent 不是“变笨”,而是被后端基础设施活活拖死的。Eric Allam 在这场演讲里抛出一个反直觉结论:传统三十年的无状态后端范式,正在系统性地阻碍 Agent 变得长期、可靠、可恢复。这篇文章讲清两条关键路线,以及为什么 Snapshot 正在反超 Replay。
很多人还在幻想:给大模型一个完美 Prompt,就能一次生成“神级结果”。但 Granola 的工程团队在台上直接泼了盆冷水:你不能 one shot 它。这段分享把 AI 产品工程里最不体面的真相摊开讲清楚——而且全是实战换来的。