OpenAI工程师内部方法论：不是造更强Agent，而是造好“缰绳”

AI PM 编辑部 · 2026年04月17日 · 104 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在比拼谁的 Agent 更聪明时，OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点：真正的工程难题不在模型，而在“Harness（缰绳）”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向，Agent 负责执行。

OpenAI工程师内部方法论：不是造更强Agent，而是造好“缰绳”

当所有人都在比拼谁的 Agent 更聪明时，OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点：真正的工程难题不在模型，而在“Harness（缰绳）”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向，Agent 负责执行。

最反直觉的开场：Agent 不是主角，人类才是

Ryan 一上来就把很多人的认知“掀桌子”了。在他描述的未来软件工程里，Agent 的定位不是“自主智能体”，而是被人类牢牢牵着的执行引擎。人类负责设定目标、拆解问题、判断好坏；Agent 才去跑长周期任务，把“全活儿干完”。

这听起来像是给 Agent 降级，但恰恰相反。Ryan 强调，这是在释放 Agent 的真实能力：当你不再让模型承担过多模糊判断，而是清晰地告诉它“该往哪儿走”，它反而能在长时间跨度里稳定产出结果。这也是他反复提到的那句话的潜台词——“get the agents to do the full job”，前提是方向盘必须在人类手里。

技能迁移正在发生：每个人都成了“Staff Engineer”

演讲中一个被很多人低估的判断是：工程师的技能栈已经在悄悄迁移。Ryan 说，在这个世界里，“每一个人都是 staff engineer”。

原因并不玄学。Agent 能写代码、改代码、重构代码，而且是大规模、低边际成本地做。于是，个人工程师的价值不再体现在敲了多少行代码，而是体现在：你能不能挑对方案、能不能在多个候选解法中快速判断“哪个值得进仓库”。

这也是为什么他说，大规模重构在这个世界里几乎是‘免费的’。过去让人头疼的重构风险、时间成本，现在被 Agent 吃掉了。留下来的问题只剩一个：你有没有足够好的工程判断力。

Harness Engineering：真正的护城河在“约束”

Ryan 把自己在 OpenAI 内部构建大量 Agent 的经验，浓缩成一个词：Harness Engineering。直译是“缰绳工程”，本质是为 Agent 设计一套可控、可扩展的执行框架。

一个关键原则非常反直觉：要尽量减少模型需要“激活的注意力”。不是给更多上下文、更多提示，而是通过结构化的 harness，把不该让模型思考的事情全部前置、固化。

效果是什么？在后面的问答中他提到，当一个好的 harness 成形后，团队能清晰地看到“slop”——也就是模型输出里的噪音和废话——在一次次迭代中持续下降。这不是模型升级带来的，而是工程约束带来的。

提示工程的下一阶段：Agent 开始“看你的提示”

很多人以为提示工程已经玩到头了，但 Ryan 给了一个更进一步的视角：下一阶段，是让 Agent 帮你检查、生成、甚至改写提示。

他提到的不是炫技，而是一种工程现实：当系统复杂到一定程度，人类已经很难凭直觉判断一个 prompt 在长链路里会产生什么后果。这时，让 Agent 去“看 prompt 本身”，反而更可靠。

这也解释了为什么他反复强调 repository 的价值——你编码进去的不只是代码，还有决策、偏好和工程经验。Agent 能读取、复用这些杠杆，是因为你先把它们写成了系统的一部分。

别把缰绳造成枷锁：什么时候该停手

在演讲后段，一个问题非常现实：Harness 会不会被过度工程？

Ryan 的回答并不抽象——判断标准只有一个：它是不是在“对的时间点”介入。如果 harness 开始替你做价值判断、替你掩盖系统本身的问题，那它已经从缰绳变成了枷锁。

他提出的隐含建议是：先解决短期 blocker，再谈宏大的系统设计。一旦关键约束被解锁，上层能力是可以自然叠加的，而不是一开始就设计一个“完美框架”。

总结

这场演讲真正有冲击力的地方在于，它把焦点从“模型有多强”拉回到“工程师该怎么变强”。如果你在做 AI 产品或内部工具，Ryan 的信息很明确：别急着追更大的 Agent，先问问自己有没有一套清晰的 harness。

短期行动建议很简单：把判断、约束和偏好写进系统；把不该让模型思考的事情工程化；观察输出里的 slop 是否在下降。未来真正拉开差距的，不是谁的 Agent 更聪明，而是谁更懂得怎么牵住它。

关键词： OpenAI， AI Agent， Harness Engineering，提示工程，注意力机制

事实核查备注：需要核查：演讲者姓名拼写（Ryan Lopopolo 在视频字幕中可能有误拼）；演讲地点为伦敦；关于“大规模重构是免费的”“slop 减少”的表述为演讲观点而非量化结论。

返回文章列表