DeepMind工程师坦白：不是你不够强，是AI Agent逼你放弃老派工程思维

AI PM 编辑部 · 2026年05月30日 · 10 阅读 · AI/人工智能

大语言模型 AI Agent Gemini Google Google DeepMind

正在加载视频...

视频章节

在DeepMind内部，最资深的工程师也频频被AI Agent“折磨”。Gemini负责人Philipp Schmid用10分钟讲清一个残酷事实：做Agent最难的，不是模型，而是你必须放弃过去十年赖以成功的软件工程直觉。

DeepMind工程师坦白：不是你不够强，是AI Agent逼你放弃老派工程思维

在DeepMind内部，最资深的工程师也频频被AI Agent“折磨”。Gemini负责人Philipp Schmid用10分钟讲清一个残酷事实：做Agent最难的，不是模型，而是你必须放弃过去十年赖以成功的软件工程直觉。

第一刀就很狠：在Agent世界里，"文本"取代了"数据结构"

如果你是传统工程师，这句话会让你不舒服——“text is our new state”。Schmid说，工程师之所以痛苦，是因为我们太习惯用结构化数据描述世界：状态机、Schema、表结构、枚举值。但在Agent里，世界不是被建模出来的，而是被“理解”出来的。

Agent面对的是连续变化的上下文、模糊的语义和无法枚举的用户意图。你没法提前定义好所有状态，更没法用if-else覆盖所有路径。个性化、长期记忆、多轮推理，这些东西一旦落到代码层面，几乎无法被传统数据结构优雅承载。

所以Agent工程的第一道心理关，是承认一件事：你写的不是“状态转移逻辑”，而是在维护一段不断生长的文本上下文。你不再完全“控制”系统，而是在引导它理解世界。

第二个反直觉：想做出好Agent，你必须学会“放权”

Schmid提到一个经典场景：客服系统。过去的流程是确定性的——用户说“我要取消订阅”，系统走固定路径。但真实世界不是这样，用户会抱怨、犹豫、反复横跳。

如果你还试图用规则覆盖所有可能性，结果只有一个：系统复杂到无法维护。Agent的解法恰恰相反——“trust the LLM”。不是完全放飞，而是接受非确定性。

这也是很多高级工程师最难跨过的一步：我们被训练去消灭不确定性，而Agent要求你拥抱它。模型有时会走一条你没预期的路径，甚至看起来‘很怪’，但只要结果对了，它就是好Agent。

从‘我设计每一步’到‘我验证最终结果’，这是一次角色的根本转变。

真正击垮老方法的，是错误、测试和API这三件事

在Agent系统里，错误不再只是异常，而是新的输入。一次HTTP失败、一个工具超时，不应该让流程重来，而是成为Agent继续推理的材料。

这直接导致第二个变化：单元测试不够用了。Agent是非确定性的，你不能指望“这次一定成功”，你只能问——十次里能成功几次？所以评估（eval）取代断言（assert），结果比过程重要。

最后一刀是API。API是为人类工程师设计的，但Agent看不到你的代码，只看得到函数名、schema和文档字符串。很多现有API对Agent来说“根本不可读”。Schmid的建议很直接：Agent会变，但API不会，你要为一个‘不懂业务背景的模型’设计工具。

总结成一句话：Agent时代的软件，是一次性的、可删除的、不断演化的。

总结

这场分享最残酷、也最有价值的地方在于：它没有教你某个框架或技巧，而是逼你重构工程信仰。如果你还在用“确定性、全覆盖、强控制”的方式做Agent，痛苦几乎是必然的。真正可行的路径，是接受文本为核心状态、把错误当作信号、用评估而非测试定义成功，并为Agent而非人类设计API。对AI从业者来说，这不是工具升级，而是一次工程哲学的换代。你现在的代码，有多少是为‘可删除’而写的？

关键词： AI Agent，大语言模型， Gemini， Google DeepMind，软件工程转变

事实核查备注：需要核查：演讲者姓名Philipp Schmid及其在Google DeepMind/Gemini Agent方向的角色；视频发布时间2026-05-30；视频时长约10分钟；核心观点表述是否与原视频语义一致

返回文章列表