正在加载视频...
视频章节
很多团队以为给 AI Agent 喂够文档就万事大吉,但 Zach Blumenfeld 在这场分享里泼了一盆冷水:真正决定 Agent 上限的,不是资料量,而是它能否看见“过去是怎么做决定的”。一旦你理解了“决策痕迹”,就很难再用老方法做 Agent。
AI Agent 的致命短板:只有文档,没有“决策痕迹”
很多团队以为给 AI Agent 喂够文档就万事大吉,但 Zach Blumenfeld 在这场分享里泼了一盆冷水:真正决定 Agent 上限的,不是资料量,而是它能否看见“过去是怎么做决定的”。一旦你理解了“决策痕迹”,就很难再用老方法做 Agent。
最反直觉的一点:文档越多,Agent 反而越容易犯错
Zach 一上来就点破了一个很多从业者不愿承认的事实:我们给 Agent 的“上下文”,大多只是静态文档。PRD、规范、历史说明,看起来很全,但它们缺了一样关键东西——为什么当初会做出那个决定。
在真实组织里,重要决策往往伴随着争论、取舍、否决和妥协。文档只记录了“结果”,却抹掉了“过程”。当 Agent 只能看到结果,它就会把每个决定当成理所当然,完全不知道哪些方案曾经被认真考虑、又为什么被否掉。这也是为什么很多 Agent 在边缘场景下会给出“看似合理、实际上踩雷”的答案。
Context Graph:把“记忆”从文档,升级为决策网络
Zach 提出的解决思路是所谓的 context graph(上下文图)。核心不是多存一点信息,而是换一种存储方式:用图来记录“谁,在什么背景下,基于哪些理由,做了什么决定”。
在他的例子里,记忆不再只是文本,而是由员工、历史决策、约束条件和结果共同构成的关系网络。这样一来,Agent 在面对新问题时,不是简单做相似度搜索,而是可以追溯:有没有类似情境?当时的推理链条是什么?哪些路径最终导致了 reject decision?
这里有一句非常关键的隐含观点:真正有价值的不是答案本身,而是“答案是怎么被证明不行的”。
为什么“找先例”这件事,文档永远做不好
Zach 特别强调了一个能力:find precedents(寻找先例)。这听起来像是检索问题,但本质完全不同。
如果你只有文档,所谓的先例只是“文字相似”。而在 context graph 里,先例是结构相似:相同的约束、相似的目标、类似的风险权衡。Agent 不只是看到一句话,而是看到一整段 reasoning trace——从假设到尝试,再到被否定的原因。
这也解释了为什么很多团队发现:RAG 在 demo 里很好用,一到复杂决策就崩。不是模型不聪明,而是你给它的世界观太扁平。
真正重要的不是 Demo,而是“推理痕迹”能否被复用
在分享后半段,Zach 展示了 context graph 的 demo、代码和网站资源,但他反复回到同一个点:项目的核心不是某个实现,而是把 reasoning traces 当成一等公民。
一旦你的系统开始系统性地记录推理痕迹,它的价值会随着时间复利式增长。新人进来,不是只读文档,而是理解“我们为什么这么做”;Agent 上线,不是凭空推理,而是站在过往决策的肩膀上。这是一种从“知识管理”到“决策管理”的转变。
总结
这场分享真正值得带走的,不是某个技术名词,而是一个判断标准:如果你的 AI Agent 只能复述结论,却说不清“当初为什么没选另一条路”,那它注定只能停留在助理级别。对从业者来说,一个可执行的行动是:回看你现有的 Agent 架构,问自己一句——我们有没有系统性地保存决策被否定的原因?如果没有,也许该从“记录推理痕迹”这一步开始,而不是再加一个向量库。
关键词: AI Agent, 决策痕迹, Context Graph, Reasoning Trace, Neo4j
事实核查备注: 需要核查:Zach Blumenfeld 的职务与 Neo4j 关系;context graph 是否为正式产品或概念名称;find precedents 是否为原话或功能描述;视频中是否明确提到 reasoning traces 的定义。