OpenAI 用一次 Build Hour,悄悄把 AI Agent 的“工作方式”改了

AI PM 编辑部 · 2025年09月03日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在把大模型当聊天机器人用,这场 Build Hour 可能会让你意识到:你已经落后了。OpenAI 在这次公开视频里,没有发布新模型,却提出了一个更危险的变化——让模型不再“聊天”,而是开始“做任务”。

OpenAI 用一次 Build Hour,悄悄把 AI Agent 的“工作方式”改了

如果你还在把大模型当聊天机器人用,这场 Build Hour 可能会让你意识到:你已经落后了。OpenAI 在这次公开视频里,没有发布新模型,却提出了一个更危险的变化——让模型不再“聊天”,而是开始“做任务”。

真正反直觉的点:OpenAI 不想让你盯着模型“怎么想”了

这场 Build Hour 一开始就释放了一个不太符合直觉的信号:过去我们痴迷于每一轮 prompt、每一步 reasoning,但现在,这件事的重要性正在被刻意降低。视频中明确提到,"Everything used to be very chatbased"——过去一切都围绕对话展开,而开发者往往并不真的关心模型中间经历了多少轮思考。

这不是能力退化,而是抽象升级。OpenAI 的判断是:当模型开始具备 agentic tool calling 能力时,开发者真正关心的已经不再是“它怎么想”,而是“它有没有把事办完”。这句话背后,是对整个 AI 应用形态的重新定义。

关键词不是 Tool Calling,而是一个新抽象:Tasks

视频里最重要的一次转折,发生在“为什么这和今天的 Build Hour 有关”那一刻。答案不是工具调用本身,而是由此引出的新原语——Tasks。

在 agentic tool calling 的前提下,模型不再只是被动响应,而是可以围绕一个任务目标,自主决定调用哪些工具、执行哪些步骤。任务成为新的抽象层:它屏蔽了中间过程,把复杂行为压缩成一个可以被管理、被监控、被评价的单元。

这也是为什么视频中会自然地引出 graders(评分器)和进度展示的问题。当你不再关心每一步对话,而只关心任务是否完成,就必须有新的方式来判断质量、展示进展、处理失败。这不是模型问题,而是系统设计问题。

从 Demo 到产品:真正困难的是“让用户看得懂”

Build Hour 的后半段明显从技术转向产品。代码可以很快写出来,tasks 也可以简单跑通,但一旦进入真实产品环境,问题立刻变了:如何向用户展示进度?如何解释一个任务为什么还没完成?失败了算谁的?

视频里多次回到 diagram,不断追问同一个问题:How do we surface progress to the user? 这句话点中了很多 AI Agent 产品的痛点——当模型在后台自主行动时,用户最容易失去安全感。

OpenAI 给出的方向并不是“解释所有细节”,而是选择性暴露:进度、状态、结果,而不是完整思考链。这和前面“弱化 chat”的思路是完全一致的。

被一笔带过,但非常关键的主题:Delegation

在接近尾声时,视频轻描淡写地提到了一点 delegation(任务委派),甚至用了一句“hopefully you can believe me”。这看似随意,其实信息量很大。

Delegation 意味着 tasks 不只是线性的单体任务,而是可以拆分、分发、组合。这是多 Agent 系统的入口,也是未来复杂 AI 系统的基础能力。虽然这次 Build Hour 没有展开,但它清楚地暗示:agentic tool calling + tasks 只是第一层,更复杂的协作还在后面。

对熟悉行业的人来说,这是一个明确的信号:OpenAI 在为更大规模的 Agent 系统铺路。

总结

这场 Build Hour 最重要的收获,并不是某个 API 或代码技巧,而是一个观念转变:从“和模型对话”,转向“让模型完成任务”。如果你在做 AI 应用,这意味着你需要重新思考产品结构、用户预期和失败处理方式;如果你是开发者,现在就是开始用 tasks 思维重构系统的最好时机。可以留一个问题给自己:如果用户不再看到模型的每一步思考,你的产品,是否依然值得信任?


关键词: AI Agent, Agentic Tool Calling, Tasks 抽象, AI 产品设计, OpenAI Build Hour

事实核查备注: 需要核查:视频具体时长;Build Hour 是否为公开视频系列名称;agentic tool calling 与 tasks 的官方定义表述;Delegation 是否在视频中被明确提出为概念而非随口一提。