8分钟上线一个AI Agent:OpenAI这次把“复杂”直接删掉了
在 DevDay 的舞台上,OpenAI 做了一件看起来“几乎不可能”的事:8分钟,从零到上线,一个可用、可控、可部署的 AI Agent。没有炫技代码,没有复杂架构,甚至连“写代码”都不是第一步。这场 AgentKit Demo,真正震动的是每一个做 AI 应用的人。
在 DevDay 的舞台上,OpenAI 做了一件看起来“几乎不可能”的事:8分钟,从零到上线,一个可用、可控、可部署的 AI Agent。没有炫技代码,没有复杂架构,甚至连“写代码”都不是第一步。这场 AgentKit Demo,真正震动的是每一个做 AI 应用的人。
当所有公司都在谈“AI怎么卖给客户”时,OpenAI在台上丢出一个反直觉结论:真正决定AI上限的,是你有没有把它用在自己公司内部。这场演讲首次系统披露了OpenAI内部三个真实AI Agent案例,展示了AI如何直接改变销售、HR和客服的工作方式。
当所有人都以为 OpenAI 会继续把最强模型牢牢攥在 API 里时,他们却拿出了 GPTOSS——能本地跑、能微调、还能离线推理的开源模型。这不是一次象征性的“开放姿态”,而是一次对开发者工作方式的正面回应。
如果我告诉你,今天最前沿的 AI 评测方法,正在全面否定我们过去十年用过的所有 benchmark,你可能会愣住。OpenAI 邀请 Arc Prize 基金会公布的新一代 AGI 测试,核心结论只有一句话:静态考试,根本测不出真正的智能。
大多数人盯着 Sora、ImageGen、Codex 的“效果”,但 OpenAI 在这支视频里展示的,是更狠的一件事:他们正在重写创意生产的工作流程本身。从分镜、协作到工具衔接,创作不再是一锤一锤敲出来的。
如果你以为模型分数越来越高,就等于能直接上生产,那这场OpenAI的分享会让你清醒。强化学习研究员Tel在台上直说:我们被“好看但没用”的评测骗了很久。这次,他们把评测拉进真实世界。
在这场 OpenAI Dev Day 上,最让人意外的不是模型参数或新 API,而是旧金山市长亲自站台,讲清楚一件事:AI 已经开始直接介入城市运转。从报修、外勤,到实时语音识别,旧金山正在成为 AI 落地最激进、也最现实的试验场。
在DevDay铺天盖地的产品发布之外,OpenAI与AMD的一笔算力交易可能才是更具长期意义的信号。它不仅关乎6GW级别的AI芯片部署,更揭示了OpenAI的算力战略、行业协作逻辑,以及这一轮AI周期与历史科技泡沫的本质差异。
过去一年,AI Agent 被说成“下一个应用平台”,但真正能把它做出来的人并不多。OpenAI 刚发布的 Agent Builder,正在把这件事从“工程师专属”拉向“人人可用”。更反直觉的是:它不是新模型,而是一个视觉化工具,却可能改变 AI 产品的开发方式。
这是一篇基于 The AI Daily Brief 对 OpenAI DevDay 2025 的即时反应解读。文章围绕一个尖锐问题展开:OpenAI 最新发布的 Apps、Agent Kit 等能力,是否正在从根本上改变 AI Agent 创业公司的生存空间,并分析其中真正的威胁与机会。