OpenAI工程师内部方法论:不是造更强Agent,而是造好“缰绳”

AI PM 编辑部 · 2026年04月17日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在比拼谁的 Agent 更聪明时,OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点:真正的工程难题不在模型,而在“Harness(缰绳)”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向,Agent 负责执行。

OpenAI工程师内部方法论:不是造更强Agent,而是造好“缰绳”

当所有人都在比拼谁的 Agent 更聪明时,OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点:真正的工程难题不在模型,而在“Harness(缰绳)”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向,Agent 负责执行。

最反直觉的开场:Agent 不是主角,人类才是

Ryan 一上来就把很多人的认知“掀桌子”了。在他描述的未来软件工程里,Agent 的定位不是“自主智能体”,而是被人类牢牢牵着的执行引擎。人类负责设定目标、拆解问题、判断好坏;Agent 才去跑长周期任务,把“全活儿干完”。

这听起来像是给 Agent 降级,但恰恰相反。Ryan 强调,这是在释放 Agent 的真实能力:当你不再让模型承担过多模糊判断,而是清晰地告诉它“该往哪儿走”,它反而能在长时间跨度里稳定产出结果。这也是他反复提到的那句话的潜台词——“get the agents to do the full job”,前提是方向盘必须在人类手里。

技能迁移正在发生:每个人都成了“Staff Engineer”

演讲中一个被很多人低估的判断是:工程师的技能栈已经在悄悄迁移。Ryan 说,在这个世界里,“每一个人都是 staff engineer”。

原因并不玄学。Agent 能写代码、改代码、重构代码,而且是大规模、低边际成本地做。于是,个人工程师的价值不再体现在敲了多少行代码,而是体现在:你能不能挑对方案、能不能在多个候选解法中快速判断“哪个值得进仓库”。

这也是为什么他说,大规模重构在这个世界里几乎是‘免费的’。过去让人头疼的重构风险、时间成本,现在被 Agent 吃掉了。留下来的问题只剩一个:你有没有足够好的工程判断力。

Harness Engineering:真正的护城河在“约束”

Ryan 把自己在 OpenAI 内部构建大量 Agent 的经验,浓缩成一个词:Harness Engineering。直译是“缰绳工程”,本质是为 Agent 设计一套可控、可扩展的执行框架。

一个关键原则非常反直觉:要尽量减少模型需要“激活的注意力”。不是给更多上下文、更多提示,而是通过结构化的 harness,把不该让模型思考的事情全部前置、固化。

效果是什么?在后面的问答中他提到,当一个好的 harness 成形后,团队能清晰地看到“slop”——也就是模型输出里的噪音和废话——在一次次迭代中持续下降。这不是模型升级带来的,而是工程约束带来的。

提示工程的下一阶段:Agent 开始“看你的提示”

很多人以为提示工程已经玩到头了,但 Ryan 给了一个更进一步的视角:下一阶段,是让 Agent 帮你检查、生成、甚至改写提示。

他提到的不是炫技,而是一种工程现实:当系统复杂到一定程度,人类已经很难凭直觉判断一个 prompt 在长链路里会产生什么后果。这时,让 Agent 去“看 prompt 本身”,反而更可靠。

这也解释了为什么他反复强调 repository 的价值——你编码进去的不只是代码,还有决策、偏好和工程经验。Agent 能读取、复用这些杠杆,是因为你先把它们写成了系统的一部分。

别把缰绳造成枷锁:什么时候该停手

在演讲后段,一个问题非常现实:Harness 会不会被过度工程?

Ryan 的回答并不抽象——判断标准只有一个:它是不是在“对的时间点”介入。如果 harness 开始替你做价值判断、替你掩盖系统本身的问题,那它已经从缰绳变成了枷锁。

他提出的隐含建议是:先解决短期 blocker,再谈宏大的系统设计。一旦关键约束被解锁,上层能力是可以自然叠加的,而不是一开始就设计一个“完美框架”。

总结

这场演讲真正有冲击力的地方在于,它把焦点从“模型有多强”拉回到“工程师该怎么变强”。如果你在做 AI 产品或内部工具,Ryan 的信息很明确:别急着追更大的 Agent,先问问自己有没有一套清晰的 harness。

短期行动建议很简单:把判断、约束和偏好写进系统;把不该让模型思考的事情工程化;观察输出里的 slop 是否在下降。未来真正拉开差距的,不是谁的 Agent 更聪明,而是谁更懂得怎么牵住它。


关键词: OpenAI, AI Agent, Harness Engineering, 提示工程, 注意力机制

事实核查备注: 需要核查:演讲者姓名拼写(Ryan Lopopolo 在视频字幕中可能有误拼);演讲地点为伦敦;关于“大规模重构是免费的”“slop 减少”的表述为演讲观点而非量化结论。