OpenAI工程师内部方法论:不是造更强Agent,而是造好“缰绳”
当所有人都在比拼谁的 Agent 更聪明时,OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点:真正的工程难题不在模型,而在“Harness(缰绳)”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向,Agent 负责执行。
当所有人都在比拼谁的 Agent 更聪明时,OpenAI 的 Ryan Lopopolo 却在伦敦抛出一个反直觉观点:真正的工程难题不在模型,而在“Harness(缰绳)”。这场演讲揭示了一个正在内部成形的软件新范式——人类负责方向,Agent 负责执行。
在这期 Latent Space 对谈里,Notion 团队并没有炫技,而是罕见地讲清楚了他们在 AI 落地中真正被卡住的地方:上下文窗口太短、权限系统反复推倒重来、Evals 只有 30% 能通过。更反直觉的是,他们认为 AI 的终局不是“替代人”,而是“吃掉流程”。
很多团队都在用大模型给大模型打分,但结果往往不稳定、不可复现,甚至越优化越偏。Mahmoud Mabrouk 在这场实战型分享里直接开炮:问题不在模型,而在“裁判”。更关键的是,他给出了一套真的跑得通的解法。
当整个行业都在押注“替你行动”的AI代理时,Waypoint 的 AI 负责人 Šimon Podhajský 反其道而行,做了一个什么都不替你做的个人AI。它只读、不写、不执行,却能从你的“认知废气”里,拆解出你真正的注意力、意图断层和关系衰退。这不是退步,而是另一条更冷静的进化路线。
当 AI 从“自动补全”进化到“自己写、自己跑、自己改代码”,我们交付速度飙升,但风险也被彻底低估。Cloudflare 的开发者布道师直言:你正在运行的,可能是来自互联网的、不可信代码。这场演讲讲清了一个所有 AI 工程师都绕不开的问题:为什么必须 sandbox AI 生成的代码,以及怎么做才不翻车。
Anthropic 再次“手滑”泄露 Claude Code 源码,有人只是围观,而 Riley Brown 直接下载、拆解、改人格、换UI,甚至做成桌面应用。这不是黑客炫技,而是一堂关于“AI Agent到底是怎么被造出来的”公开课。
一个多年只用 React 的开发者,在 2025 年被 Svelte“反向安利”了,而且还开始为它辩护。更反直觉的是:他说 Svelte 不但性能更好,还**更适合 AI 编程时代**。这篇文章讲清楚他为什么改变立场,以及这对 AI 从业者意味着什么。
黄仁勋最近抛出一个炸裂判断:每一家公司都需要一个 OpenClaw 式的 agentic system。这不是更聪明的 ChatGPT,而是一种“新电脑”。Greg Isenberg 拉着 OpenClaw 重度用户 Moritz Kram,用 64 分钟拆解了一个残酷现实:90% 的人装对了 OpenClaw,却完全没用对。
一个健康汽水的病毒式营销创意,核心卖点居然是“好好拉屎”。更夸张的是,从logo、易拉罐到海报和社媒物料,全部在30分钟内完成。Figma这期视频,真正炸点不在创意有多野,而在于:生成式AI已经开始改变设计、营销乃至内容生产的底层工作流。
当所有人还在卷模型、卷参数时,Anthropic 团队却踩下了刹车:真正限制 AI Agent 的,不是智力,而是上下文。Claude Code 团队用一个看似“笨”的设计,意外打开了 Agent 时代的天花板。