95%的AI Agent都做错了:Greg Isenberg用一套文件颠覆你的构建方式

AI PM 编辑部 · 2026年04月08日 · 16 阅读 · AI/人工智能

正在加载视频...

视频章节

你以为 AI Agent 的核心是更聪明的模型,但 Greg Isenberg 在这期播客里反复强调:真正拉开差距的,是上下文、流程和“技能文件”。更反直觉的是,模型并不会思考——但你依然可以把它训练得像一个老员工。

95%的AI Agent都做错了:Greg Isenberg用一套文件颠覆你的构建方式

你以为 AI Agent 的核心是更聪明的模型,但 Greg Isenberg 在这期播客里反复强调:真正拉开差距的,是上下文、流程和“技能文件”。更反直觉的是,模型并不会思考——但你依然可以把它训练得像一个老员工。

最反直觉的一点:模型不思考,但Agent可以“像人一样干活”

节目里有一句话几乎是全场的“分水岭”——“models actually don't think”。这不是哲学争论,而是工程现实。模型不会理解目标、不会规划长期策略,更不会自我反省。

但这并不意味着 Agent 没戏。Greg 和嘉宾强调,Agent 的价值不在于‘思考’,而在于被放进一个设计好的工作环境。就像新员工:他一开始也不懂,但只要流程清晰、反馈及时,很快就能稳定产出。

这也是为什么他们反复说:如果你对 Agent 的期待是‘像人一样思考’,你一定会失望;但如果你把它当成一个严格执行流程的角色,成功率反而会飙升。

真正的护城河不是模型,是你给它的“上下文”

视频前 10 分钟花了大量时间讲 context,看似基础,其实是核心。Greg 直接点破一个行业误区:95% 的情况下,Agent 出问题不是模型不行,而是上下文给错了

他们提到,系统 prompt、历史对话、工具说明、私有信息,全部都会占用 token。但关键不在 token 数量,而在结构。一个 20,000 token 的杂乱上下文,远不如一个被精心组织的工作说明。

这里有个很重要的判断:上下文不是‘记忆’,而是‘工作现场’。你不是在让模型回忆过去,而是在告诉它:现在你是谁、你在干什么、你该怎么做下一步。

agent.mmd、skills.md:把隐性经验写成机器能用的文件

从第 4 分钟开始,节目进入最“干货”的部分:文件化 Agent 能力。

他们展示了 agent.mmd、claw.mmd、skills.md 这些文件的思路。重点不是文件格式本身,而是一种方法论——把你脑子里的经验,拆成可递归更新的技能

skills.md 是核心。每当 Agent 完成一次任务,你不是只看结果,而是让它 review 自己做了什么、哪里做得好、哪里可以标准化,然后反过来更新 skills 文件。久而久之,你得到的不是一个聪明的模型,而是一套越来越成熟的‘岗位说明书’。

这也是为什么 Greg 说,这些 Agent 很像‘非常新的员工’:能力不强,但学习路径是可控的。

别迷信多Agent:先把一个Agent打磨到能赚钱

节目后半段,他们对当下流行的 multi-agent 风潮泼了一盆冷水。

Greg 观察到,很多人一上来就设计复杂的 Agent 网络,结果每个 Agent 都半吊子,最终系统不可控。他的建议很简单:从一个 Agent 开始,把一个具体 workflow 做到极致。

节目里举的例子是 sponsor email 的流程:每一封邮件都走同样的步骤、同样的检查清单。Agent 不需要理解‘商业合作的本质’,只要严格执行流程,就能稳定产出可用结果。

等这个 Agent 足够稳定,再考虑拆分、协作,而不是一开始就追求架构美感。

真正的趋势:Agent 的差距,会变成“技能库”的差距

最后 10 分钟,话题上升到趋势判断。

他们并不认为未来会出现人人都用同一套 Agent 的情况。相反,差距会越来越大——不是模型,而是你积累了多少可复用的 skills。

递归构建 skills、不断 update skill.md,本质上是在把个人经验产品化。谁先完成这一步,谁就拥有长期优势。Greg 甚至暗示:这会形成一种新的‘能力分层’,而不是简单的工具平权。

总结

这期节目最重要的启发是:别再把时间花在‘找更聪明的模型’上了。真正值得投入的,是流程、上下文和技能沉淀。对从业者来说,最实际的行动是三步:选一个高频 workflow;把流程写成明确的 system prompt 和 skills 文件;每次执行后强制复盘并更新技能库。长期来看,你不是在训练一个 Agent,而是在打造一套可复制的数字员工体系。问题只剩一个:你现在的工作,有多少是可以被写进 skills.md 的?


关键词: AI Agent, 上下文, Token, skills.md, 工作流

事实核查备注: 需要核查:1)“95% 的情况下 Agent 出问题源于上下文”的原话表述;2)agent.mmd、skills.md 是否为视频中展示的真实文件名;3)关于模型‘不思考’的表述是否为嘉宾原句或意译;4)视频发布时间与链接一致性。