LLM 代码生成最致命的失败，不是模型，而是你自己

AI PM 编辑部 · 2026年04月30日 · 38 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你觉得 LLM 写代码翻车，是因为模型不够聪明，这个视频会狠狠打你的脸。PostHog 的 Danilo Campos 用一连串“被机器人打到流鼻血”的真实经验，拆穿了 autonomous coding agent 最常见、也最容易被忽视的失败根源。

LLM 代码生成最致命的失败，不是模型，而是你自己

如果你觉得 LLM 写代码翻车，是因为模型不够聪明，这个视频会狠狠打你的脸。PostHog 的 Danilo Campos 用一连串“被机器人打到流鼻血”的真实经验，拆穿了 autonomous coding agent 最常见、也最容易被忽视的失败根源。

最反直觉的真相：机器人没疯，是你把它喂疯了

Danilo 一上来就抛出一个让人不舒服的事实：大多数 codegen 失败，并不是模型能力不行，而是上下文给错了。模型“看起来”在胡写代码，实际上是在忠实地执行一个已经过期、残缺甚至自相矛盾的指令环境。他把这种现象称为一种现实版的“model rot”——模型没变，但你喂给它的世界已经腐烂。结果就是：agent 一本正经地走上了一条你完全没预期的技术路线，而且逻辑还自洽得可怕。

为什么 LLM 总能写出“形对但魂不对”的集成代码

Danilo 提到一个非常细腻但关键的观察：这些模型“见过所有项目”，但它们学到的是模式，而不是你的意图。于是你会得到一种诡异的结果——集成的“形状”是对的，接口、目录结构、调用方式都像那么回事，但放进真实系统里就是不 work。这不是随机错误，而是模式补全的必然结果。解决思路也很工程化：不要指望 agent 理解你的系统，而是主动给它一个可重复、可完成的正确形状，让它只在你允许的空间内补全。

真正的高风险点：奇怪架构 + 奇怪路径 + 完全合理的错误

当系统架构本身已经够“非主流”，agent 就更容易在问题空间里找到一条你从未想过的路径。Danilo 强调，这些修改“既不愚蠢，也不是发疯”，它们在模型的视角下完全合理。这正是 autonomous agent 最危险的地方：它不是乱来，而是太有逻辑了。你以为它在帮你写代码，实际上它在帮你重新设计系统，而你甚至没意识到自己已经授权了。

最大的敌人不是模型，是人类的职业惯性

视频里最扎心的一段，是 Danilo 承认：我们整个职业生涯都被奖励“亲手写代码”，而现在，真正的稀缺能力变成了另一件事——如何排序、裁剪、喂给 agent 正确的信息。人类错误成了 agent 结果的最大威胁，而解决方法听起来又简单到残酷：你必须问清楚、验证清楚、盯紧那些跑在别人机器上的 agent shenanigans。信任不是默认值，而是需要持续审计的配置项。

总结

这场分享真正改变视角的地方在于：codegen 的成败，已经从“模型够不够强”，转移到了“你有没有设计好一个不让它犯错的环境”。对 AI 从业者来说，下一阶段的核心竞争力，不是写更快的代码，而是构建更干净的上下文、更受控的行动空间，以及更严格的人类介入点。留给你的思考是：如果 agent 的每一次失败，都是你信息排序的失败，那你现在的工作方式，还配得上“高级工程师”这个称号吗？

关键词： LLM，代码生成， AI Agent， Autonomous Coding，工程实践

事实核查备注：需要核查：演讲者 Danilo Campos 的身份与所属公司 PostHog；视频发布时间 2026-04-30；“model rot”是否为原话或意译；引用观点是否均来自视频内容而非外部推断

返回文章列表