95%的AI Agent都做错了：Greg Isenberg用一套文件颠覆你的构建方式

AI PM 编辑部 · 2026年04月08日 · 16 阅读 · AI/人工智能

Token

正在加载视频...

视频章节

你以为 AI Agent 的核心是更聪明的模型，但 Greg Isenberg 在这期播客里反复强调：真正拉开差距的，是上下文、流程和“技能文件”。更反直觉的是，模型并不会思考——但你依然可以把它训练得像一个老员工。

95%的AI Agent都做错了：Greg Isenberg用一套文件颠覆你的构建方式

你以为 AI Agent 的核心是更聪明的模型，但 Greg Isenberg 在这期播客里反复强调：真正拉开差距的，是上下文、流程和“技能文件”。更反直觉的是，模型并不会思考——但你依然可以把它训练得像一个老员工。

最反直觉的一点：模型不思考，但Agent可以“像人一样干活”

节目里有一句话几乎是全场的“分水岭”——“models actually don't think”。这不是哲学争论，而是工程现实。模型不会理解目标、不会规划长期策略，更不会自我反省。

但这并不意味着 Agent 没戏。Greg 和嘉宾强调，Agent 的价值不在于‘思考’，而在于被放进一个设计好的工作环境。就像新员工：他一开始也不懂，但只要流程清晰、反馈及时，很快就能稳定产出。

这也是为什么他们反复说：如果你对 Agent 的期待是‘像人一样思考’，你一定会失望；但如果你把它当成一个严格执行流程的角色，成功率反而会飙升。

真正的护城河不是模型，是你给它的“上下文”

视频前 10 分钟花了大量时间讲 context，看似基础，其实是核心。Greg 直接点破一个行业误区：95% 的情况下，Agent 出问题不是模型不行，而是上下文给错了。

他们提到，系统 prompt、历史对话、工具说明、私有信息，全部都会占用 token。但关键不在 token 数量，而在结构。一个 20，000 token 的杂乱上下文，远不如一个被精心组织的工作说明。

这里有个很重要的判断：上下文不是‘记忆’，而是‘工作现场’。你不是在让模型回忆过去，而是在告诉它：现在你是谁、你在干什么、你该怎么做下一步。

agent.mmd、skills.md：把隐性经验写成机器能用的文件

从第 4 分钟开始，节目进入最“干货”的部分：文件化 Agent 能力。

他们展示了 agent.mmd、claw.mmd、skills.md 这些文件的思路。重点不是文件格式本身，而是一种方法论——把你脑子里的经验，拆成可递归更新的技能。

skills.md 是核心。每当 Agent 完成一次任务，你不是只看结果，而是让它 review 自己做了什么、哪里做得好、哪里可以标准化，然后反过来更新 skills 文件。久而久之，你得到的不是一个聪明的模型，而是一套越来越成熟的‘岗位说明书’。

这也是为什么 Greg 说，这些 Agent 很像‘非常新的员工’：能力不强，但学习路径是可控的。

别迷信多Agent：先把一个Agent打磨到能赚钱

节目后半段，他们对当下流行的 multi-agent 风潮泼了一盆冷水。

Greg 观察到，很多人一上来就设计复杂的 Agent 网络，结果每个 Agent 都半吊子，最终系统不可控。他的建议很简单：从一个 Agent 开始，把一个具体 workflow 做到极致。

节目里举的例子是 sponsor email 的流程：每一封邮件都走同样的步骤、同样的检查清单。Agent 不需要理解‘商业合作的本质’，只要严格执行流程，就能稳定产出可用结果。

等这个 Agent 足够稳定，再考虑拆分、协作，而不是一开始就追求架构美感。

真正的趋势：Agent 的差距，会变成“技能库”的差距

最后 10 分钟，话题上升到趋势判断。

他们并不认为未来会出现人人都用同一套 Agent 的情况。相反，差距会越来越大——不是模型，而是你积累了多少可复用的 skills。

递归构建 skills、不断 update skill.md，本质上是在把个人经验产品化。谁先完成这一步，谁就拥有长期优势。Greg 甚至暗示：这会形成一种新的‘能力分层’，而不是简单的工具平权。

总结

这期节目最重要的启发是：别再把时间花在‘找更聪明的模型’上了。真正值得投入的，是流程、上下文和技能沉淀。对从业者来说，最实际的行动是三步：选一个高频 workflow；把流程写成明确的 system prompt 和 skills 文件；每次执行后强制复盘并更新技能库。长期来看，你不是在训练一个 Agent，而是在打造一套可复制的数字员工体系。问题只剩一个：你现在的工作，有多少是可以被写进 skills.md 的？

关键词： AI Agent，上下文， Token， skills.md，工作流

事实核查备注：需要核查：1）“95% 的情况下 Agent 出问题源于上下文”的原话表述；2）agent.mmd、skills.md 是否为视频中展示的真实文件名；3）关于模型‘不思考’的表述是否为嘉宾原句或意译；4）视频发布时间与链接一致性。

返回文章列表