AI Agent 的致命短板：只有文档，没有“决策痕迹”

AI PM 编辑部 · 2026年05月29日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

很多团队以为给 AI Agent 喂够文档就万事大吉，但 Zach Blumenfeld 在这场分享里泼了一盆冷水：真正决定 Agent 上限的，不是资料量，而是它能否看见“过去是怎么做决定的”。一旦你理解了“决策痕迹”，就很难再用老方法做 Agent。

AI Agent 的致命短板：只有文档，没有“决策痕迹”

很多团队以为给 AI Agent 喂够文档就万事大吉，但 Zach Blumenfeld 在这场分享里泼了一盆冷水：真正决定 Agent 上限的，不是资料量，而是它能否看见“过去是怎么做决定的”。一旦你理解了“决策痕迹”，就很难再用老方法做 Agent。

最反直觉的一点：文档越多，Agent 反而越容易犯错

Zach 一上来就点破了一个很多从业者不愿承认的事实：我们给 Agent 的“上下文”，大多只是静态文档。PRD、规范、历史说明，看起来很全，但它们缺了一样关键东西——为什么当初会做出那个决定。

在真实组织里，重要决策往往伴随着争论、取舍、否决和妥协。文档只记录了“结果”，却抹掉了“过程”。当 Agent 只能看到结果，它就会把每个决定当成理所当然，完全不知道哪些方案曾经被认真考虑、又为什么被否掉。这也是为什么很多 Agent 在边缘场景下会给出“看似合理、实际上踩雷”的答案。

Context Graph：把“记忆”从文档，升级为决策网络

Zach 提出的解决思路是所谓的 context graph（上下文图）。核心不是多存一点信息，而是换一种存储方式：用图来记录“谁，在什么背景下，基于哪些理由，做了什么决定”。

在他的例子里，记忆不再只是文本，而是由员工、历史决策、约束条件和结果共同构成的关系网络。这样一来，Agent 在面对新问题时，不是简单做相似度搜索，而是可以追溯：有没有类似情境？当时的推理链条是什么？哪些路径最终导致了 reject decision？

这里有一句非常关键的隐含观点：真正有价值的不是答案本身，而是“答案是怎么被证明不行的”。

为什么“找先例”这件事，文档永远做不好

Zach 特别强调了一个能力：find precedents（寻找先例）。这听起来像是检索问题，但本质完全不同。

如果你只有文档，所谓的先例只是“文字相似”。而在 context graph 里，先例是结构相似：相同的约束、相似的目标、类似的风险权衡。Agent 不只是看到一句话，而是看到一整段 reasoning trace——从假设到尝试，再到被否定的原因。

这也解释了为什么很多团队发现：RAG 在 demo 里很好用，一到复杂决策就崩。不是模型不聪明，而是你给它的世界观太扁平。

真正重要的不是 Demo，而是“推理痕迹”能否被复用

在分享后半段，Zach 展示了 context graph 的 demo、代码和网站资源，但他反复回到同一个点：项目的核心不是某个实现，而是把 reasoning traces 当成一等公民。

一旦你的系统开始系统性地记录推理痕迹，它的价值会随着时间复利式增长。新人进来，不是只读文档，而是理解“我们为什么这么做”；Agent 上线，不是凭空推理，而是站在过往决策的肩膀上。这是一种从“知识管理”到“决策管理”的转变。

总结

这场分享真正值得带走的，不是某个技术名词，而是一个判断标准：如果你的 AI Agent 只能复述结论，却说不清“当初为什么没选另一条路”，那它注定只能停留在助理级别。对从业者来说，一个可执行的行动是：回看你现有的 Agent 架构，问自己一句——我们有没有系统性地保存决策被否定的原因？如果没有，也许该从“记录推理痕迹”这一步开始，而不是再加一个向量库。

关键词： AI Agent，决策痕迹， Context Graph， Reasoning Trace， Neo4j

事实核查备注：需要核查：Zach Blumenfeld 的职务与 Neo4j 关系；context graph 是否为正式产品或概念名称；find precedents 是否为原话或功能描述；视频中是否明确提到 reasoning traces 的定义。

返回文章列表