这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉
正在加载视频...
视频章节
当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。
这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉
当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。
开场不是 Keynote,而是一场“降温仪式”
如果你以为一场顶级 AI 工程大会的开场一定是炫目的 demo,那 AIE Europe Day 2 会让你措手不及。舞台上反复响起的只有一个词——“Heat”。吟诵、音乐、诗性独白,谈的是无形力量、意识的外包、道德的让渡,以及人类主体性的逐渐消散。
这不是装置艺术的炫耀,而是一种明确的立场:在模型越来越强、代理越来越“自主”的当下,真正危险的不是技术做不到,而是我们太快把判断力交了出去。这个艺术化开场,像一盆冷水,直接泼在整个行业的集体亢奋上。后面一天的所有演讲,几乎都在回应这个主题。
Gemma 4 与 MCP:开放,但不是“放手不管”
Google 工程师 Omar Santoro 带来的 Gemma 4,看起来是当天最“传统”的模型发布:开源、多尺寸、多模态、多语言,甚至可以在端侧运行。许可证的变化和社区生态的强调,都在释放一个信号——开放模型不再只是研究者的玩具,而是要进入真实世界的复杂环境。
但紧接着,Anthropic 的 David Sora Par 用 MCP(Model Context Protocol)把话题拉向了另一个方向。他谈的不是“模型能做什么”,而是“模型应该如何被连接、被发现、被约束”。MCP 的关键词不是自动化,而是渐进式发现、可控的工具调用,以及面向 2026 年的 agent 连接性愿景。
一个微妙的对比浮现出来:Gemma 4 代表能力的下沉,而 MCP 代表责任的上移。模型越容易用,协议和结构就越重要。
代理没有失控,是我们太迷恋“无摩擦”
Ido Salamon 用 AgentCraft 把多代理系统讲成了一场“游戏”:任务编排、协作、可视化,一切都看起来顺滑而愉悦。但 Mario Zechner 紧随其后,几乎是当头一棒。他坦率地谈到 Pi 和 OpenClaw 的开发教训:代理滥用、上下文失控、以及开源项目在维护上的真实困境。
他的核心观点很尖锐:问题不在代理,而在节奏。我们把“快”和“自动”当成唯一目标,却忽视了人类判断本身需要时间。
随后 Armin Ronacher 与 Christina 把这种反思进一步抽象为“去摩擦化”的系统性风险。没有摩擦的系统,短期看很爽,长期却会放大错误。他们强调,结构、约束和刻意设计的摩擦,不是阻碍效率,而是保护判断力和系统可靠性的最后防线。
从 Cursor 到 Missions:工程实践正在悄悄换底层逻辑
如果说前半天在讨论“要不要慢下来”,那后半天则展示了“即便慢下来,工程也已经变了”。Cursor 工程师 David Gomez 分享了一个反直觉实践:用 Markdown 技能,替代大量代码。工作树、并行代理、Best-of 评测,不是靠更复杂的代码,而是靠更清晰的表达。
接下来,Missions 架构被提出,强调长时间运行的多代理、验证契约和串行执行。这里的关键词不再是“让代理自由发挥”,而是“让代理在约束中持续工作”。
Incident.io 则从反方向切入:如何用 AI 管 AI。Eval、回测、文件系统化调试、分析管线——这些听起来枯燥的工程细节,正在成为管理复杂 AI 系统的唯一可行路径。AI 不再只是功能模块,而是需要被审计、被回放、被追责的系统组件。
速度、品味与错觉:谁在代理时代真正占优势
当天最“冷静”的声音,来自对速度的质疑。Sarah Chang 谈到超高速代码生成模型时,重点不在生成本身,而在验证、重构和上下文管理。模型越快,人类在循环中的角色越关键。
Linear CTO Thomas Artman 进一步把话题拉回产品层面:在 AI 加速下,品味和质量文化不是自动生成的。零缺陷不是靠更多代理,而是靠更清晰的判断标准。
最后,Arena.ai 的数据分析给了所有人一记现实提醒:模型依然有明显擅长与不擅长的领域。推理、常识、专家判断,并没有因为 agent 化而 magically 消失。FOMO 和远程控制代理的诱惑,正在制造新的错觉。
总结
AIE Europe Day 2 传递的核心信息其实很一致:代理时代真正稀缺的不是算力,也不是模型,而是判断力。开放模型、强代理、自动化流程都已经在路上,但它们并不会替你承担责任。对从业者来说,下一步不是“再接一个 agent”,而是重新设计结构、摩擦和验证机制。一个值得带走的问题是:在你的系统里,哪些地方必须慢下来,才能保证它长期是对的?
关键词: AI Agent, 开源模型, 多模态, 工程文化, 判断力
事实核查备注: 需要核查:Gemma 4 的具体模型名称与发布时间;MCP 是否为 Anthropic 官方协议名称;演讲者姓名拼写(Omar Santoro, David Sora Par, Mario Zechner 等);Cursor 工程实践的具体术语使用是否准确;Missions 架构是否为正式命名。