正在加载视频...
视频章节
如果你觉得 LLM 写代码翻车,是因为模型不够聪明,这个视频会狠狠打你的脸。PostHog 的 Danilo Campos 用一连串“被机器人打到流鼻血”的真实经验,拆穿了 autonomous coding agent 最常见、也最容易被忽视的失败根源。
LLM 代码生成最致命的失败,不是模型,而是你自己
如果你觉得 LLM 写代码翻车,是因为模型不够聪明,这个视频会狠狠打你的脸。PostHog 的 Danilo Campos 用一连串“被机器人打到流鼻血”的真实经验,拆穿了 autonomous coding agent 最常见、也最容易被忽视的失败根源。
最反直觉的真相:机器人没疯,是你把它喂疯了
Danilo 一上来就抛出一个让人不舒服的事实:大多数 codegen 失败,并不是模型能力不行,而是上下文给错了。模型“看起来”在胡写代码,实际上是在忠实地执行一个已经过期、残缺甚至自相矛盾的指令环境。他把这种现象称为一种现实版的“model rot”——模型没变,但你喂给它的世界已经腐烂。结果就是:agent 一本正经地走上了一条你完全没预期的技术路线,而且逻辑还自洽得可怕。
为什么 LLM 总能写出“形对但魂不对”的集成代码
Danilo 提到一个非常细腻但关键的观察:这些模型“见过所有项目”,但它们学到的是模式,而不是你的意图。于是你会得到一种诡异的结果——集成的“形状”是对的,接口、目录结构、调用方式都像那么回事,但放进真实系统里就是不 work。这不是随机错误,而是模式补全的必然结果。解决思路也很工程化:不要指望 agent 理解你的系统,而是主动给它一个可重复、可完成的正确形状,让它只在你允许的空间内补全。
真正的高风险点:奇怪架构 + 奇怪路径 + 完全合理的错误
当系统架构本身已经够“非主流”,agent 就更容易在问题空间里找到一条你从未想过的路径。Danilo 强调,这些修改“既不愚蠢,也不是发疯”,它们在模型的视角下完全合理。这正是 autonomous agent 最危险的地方:它不是乱来,而是太有逻辑了。你以为它在帮你写代码,实际上它在帮你重新设计系统,而你甚至没意识到自己已经授权了。
最大的敌人不是模型,是人类的职业惯性
视频里最扎心的一段,是 Danilo 承认:我们整个职业生涯都被奖励“亲手写代码”,而现在,真正的稀缺能力变成了另一件事——如何排序、裁剪、喂给 agent 正确的信息。人类错误成了 agent 结果的最大威胁,而解决方法听起来又简单到残酷:你必须问清楚、验证清楚、盯紧那些跑在别人机器上的 agent shenanigans。信任不是默认值,而是需要持续审计的配置项。
总结
这场分享真正改变视角的地方在于:codegen 的成败,已经从“模型够不够强”,转移到了“你有没有设计好一个不让它犯错的环境”。对 AI 从业者来说,下一阶段的核心竞争力,不是写更快的代码,而是构建更干净的上下文、更受控的行动空间,以及更严格的人类介入点。留给你的思考是:如果 agent 的每一次失败,都是你信息排序的失败,那你现在的工作方式,还配得上“高级工程师”这个称号吗?
关键词: LLM, 代码生成, AI Agent, Autonomous Coding, 工程实践
事实核查备注: 需要核查:演讲者 Danilo Campos 的身份与所属公司 PostHog;视频发布时间 2026-04-30;“model rot”是否为原话或意译;引用观点是否均来自视频内容而非外部推断