OpenAI 用一次 Build Hour，悄悄把 AI Agent 的“工作方式”改了

AI PM 编辑部 · 2025年09月03日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在把大模型当聊天机器人用，这场 Build Hour 可能会让你意识到：你已经落后了。OpenAI 在这次公开视频里，没有发布新模型，却提出了一个更危险的变化——让模型不再“聊天”，而是开始“做任务”。

OpenAI 用一次 Build Hour，悄悄把 AI Agent 的“工作方式”改了

如果你还在把大模型当聊天机器人用，这场 Build Hour 可能会让你意识到：你已经落后了。OpenAI 在这次公开视频里，没有发布新模型，却提出了一个更危险的变化——让模型不再“聊天”，而是开始“做任务”。

真正反直觉的点：OpenAI 不想让你盯着模型“怎么想”了

这场 Build Hour 一开始就释放了一个不太符合直觉的信号：过去我们痴迷于每一轮 prompt、每一步 reasoning，但现在，这件事的重要性正在被刻意降低。视频中明确提到，"Everything used to be very chatbased"——过去一切都围绕对话展开，而开发者往往并不真的关心模型中间经历了多少轮思考。

这不是能力退化，而是抽象升级。OpenAI 的判断是：当模型开始具备 agentic tool calling 能力时，开发者真正关心的已经不再是“它怎么想”，而是“它有没有把事办完”。这句话背后，是对整个 AI 应用形态的重新定义。

关键词不是 Tool Calling，而是一个新抽象：Tasks

视频里最重要的一次转折，发生在“为什么这和今天的 Build Hour 有关”那一刻。答案不是工具调用本身，而是由此引出的新原语——Tasks。

在 agentic tool calling 的前提下，模型不再只是被动响应，而是可以围绕一个任务目标，自主决定调用哪些工具、执行哪些步骤。任务成为新的抽象层：它屏蔽了中间过程，把复杂行为压缩成一个可以被管理、被监控、被评价的单元。

这也是为什么视频中会自然地引出 graders（评分器）和进度展示的问题。当你不再关心每一步对话，而只关心任务是否完成，就必须有新的方式来判断质量、展示进展、处理失败。这不是模型问题，而是系统设计问题。

从 Demo 到产品：真正困难的是“让用户看得懂”

Build Hour 的后半段明显从技术转向产品。代码可以很快写出来，tasks 也可以简单跑通，但一旦进入真实产品环境，问题立刻变了：如何向用户展示进度？如何解释一个任务为什么还没完成？失败了算谁的？

视频里多次回到 diagram，不断追问同一个问题：How do we surface progress to the user？这句话点中了很多 AI Agent 产品的痛点——当模型在后台自主行动时，用户最容易失去安全感。

OpenAI 给出的方向并不是“解释所有细节”，而是选择性暴露：进度、状态、结果，而不是完整思考链。这和前面“弱化 chat”的思路是完全一致的。

被一笔带过，但非常关键的主题：Delegation

在接近尾声时，视频轻描淡写地提到了一点 delegation（任务委派），甚至用了一句“hopefully you can believe me”。这看似随意，其实信息量很大。

Delegation 意味着 tasks 不只是线性的单体任务，而是可以拆分、分发、组合。这是多 Agent 系统的入口，也是未来复杂 AI 系统的基础能力。虽然这次 Build Hour 没有展开，但它清楚地暗示：agentic tool calling + tasks 只是第一层，更复杂的协作还在后面。

对熟悉行业的人来说，这是一个明确的信号：OpenAI 在为更大规模的 Agent 系统铺路。

总结

这场 Build Hour 最重要的收获，并不是某个 API 或代码技巧，而是一个观念转变：从“和模型对话”，转向“让模型完成任务”。如果你在做 AI 应用，这意味着你需要重新思考产品结构、用户预期和失败处理方式；如果你是开发者，现在就是开始用 tasks 思维重构系统的最好时机。可以留一个问题给自己：如果用户不再看到模型的每一步思考，你的产品，是否依然值得信任？

关键词： AI Agent， Agentic Tool Calling， Tasks 抽象， AI 产品设计， OpenAI Build Hour

事实核查备注：需要核查：视频具体时长；Build Hour 是否为公开视频系列名称；agentic tool calling 与 tasks 的官方定义表述；Delegation 是否在视频中被明确提出为概念而非随口一提。

返回文章列表