DeepMind工程师坦白:不是你不够强,是AI Agent逼你放弃老派工程思维
正在加载视频...
视频章节
在DeepMind内部,最资深的工程师也频频被AI Agent“折磨”。Gemini负责人Philipp Schmid用10分钟讲清一个残酷事实:做Agent最难的,不是模型,而是你必须放弃过去十年赖以成功的软件工程直觉。
DeepMind工程师坦白:不是你不够强,是AI Agent逼你放弃老派工程思维
在DeepMind内部,最资深的工程师也频频被AI Agent“折磨”。Gemini负责人Philipp Schmid用10分钟讲清一个残酷事实:做Agent最难的,不是模型,而是你必须放弃过去十年赖以成功的软件工程直觉。
第一刀就很狠:在Agent世界里,"文本"取代了"数据结构"
如果你是传统工程师,这句话会让你不舒服——“text is our new state”。Schmid说,工程师之所以痛苦,是因为我们太习惯用结构化数据描述世界:状态机、Schema、表结构、枚举值。但在Agent里,世界不是被建模出来的,而是被“理解”出来的。
Agent面对的是连续变化的上下文、模糊的语义和无法枚举的用户意图。你没法提前定义好所有状态,更没法用if-else覆盖所有路径。个性化、长期记忆、多轮推理,这些东西一旦落到代码层面,几乎无法被传统数据结构优雅承载。
所以Agent工程的第一道心理关,是承认一件事:你写的不是“状态转移逻辑”,而是在维护一段不断生长的文本上下文。你不再完全“控制”系统,而是在引导它理解世界。
第二个反直觉:想做出好Agent,你必须学会“放权”
Schmid提到一个经典场景:客服系统。过去的流程是确定性的——用户说“我要取消订阅”,系统走固定路径。但真实世界不是这样,用户会抱怨、犹豫、反复横跳。
如果你还试图用规则覆盖所有可能性,结果只有一个:系统复杂到无法维护。Agent的解法恰恰相反——“trust the LLM”。不是完全放飞,而是接受非确定性。
这也是很多高级工程师最难跨过的一步:我们被训练去消灭不确定性,而Agent要求你拥抱它。模型有时会走一条你没预期的路径,甚至看起来‘很怪’,但只要结果对了,它就是好Agent。
从‘我设计每一步’到‘我验证最终结果’,这是一次角色的根本转变。
真正击垮老方法的,是错误、测试和API这三件事
在Agent系统里,错误不再只是异常,而是新的输入。一次HTTP失败、一个工具超时,不应该让流程重来,而是成为Agent继续推理的材料。
这直接导致第二个变化:单元测试不够用了。Agent是非确定性的,你不能指望“这次一定成功”,你只能问——十次里能成功几次?所以评估(eval)取代断言(assert),结果比过程重要。
最后一刀是API。API是为人类工程师设计的,但Agent看不到你的代码,只看得到函数名、schema和文档字符串。很多现有API对Agent来说“根本不可读”。Schmid的建议很直接:Agent会变,但API不会,你要为一个‘不懂业务背景的模型’设计工具。
总结成一句话:Agent时代的软件,是一次性的、可删除的、不断演化的。
总结
这场分享最残酷、也最有价值的地方在于:它没有教你某个框架或技巧,而是逼你重构工程信仰。如果你还在用“确定性、全覆盖、强控制”的方式做Agent,痛苦几乎是必然的。真正可行的路径,是接受文本为核心状态、把错误当作信号、用评估而非测试定义成功,并为Agent而非人类设计API。对AI从业者来说,这不是工具升级,而是一次工程哲学的换代。你现在的代码,有多少是为‘可删除’而写的?
关键词: AI Agent, 大语言模型, Gemini, Google DeepMind, 软件工程转变
事实核查备注: 需要核查:演讲者姓名Philipp Schmid及其在Google DeepMind/Gemini Agent方向的角色;视频发布时间2026-05-30;视频时长约10分钟;核心观点表述是否与原视频语义一致