OpenAI 扔掉“秒回”:Deep Research 为什么敢让 AI 想30分钟

AI PM 编辑部 · 2025年02月03日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

OpenAI 在东京发布了一个反直觉的新能力:AI 不再追求“快”,而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新,而是一次对“AI 应该怎么工作”的彻底改写。

OpenAI 扔掉“秒回”:Deep Research 为什么敢让 AI 想30分钟

OpenAI 在东京发布了一个反直觉的新能力:AI 不再追求“快”,而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新,而是一次对“AI 应该怎么工作”的彻底改写。

最反直觉的决定:OpenAI 主动放弃“低延迟”

在大多数 AI 产品还在卷“毫秒级响应”的时候,OpenAI 却在发布会上公开承认:Deep Research 可能要等 5 分钟,甚至 30 分钟才给你答案,而且他们认为这是“好事”。这句话本身就足够炸裂。

Mark 在介绍时讲得很直白:传统模型被默认要求“尽快给答案”,但真正高质量的研究,本来就不可能是秒级完成的。Deep Research 的定位不是聊天,而是“让模型像分析师一样工作”。这意味着它可以慢慢浏览网页、发现新线索、调整搜索路径,而不是一次性拍脑袋。

这背后其实是一个产品哲学的转向:OpenAI 不再把所有 AI 都当成“即时对话工具”,而是开始认真对待“长时间自主任务”。从这个角度看,Deep Research 更像是一个可以被放在后台跑的研究助理,而不是一个等着你追问的聊天机器人。

从 o1 到 Deep Research:推理模型终于拿到“浏览器”

如果你还记得 o1,会知道它最大的卖点是“会想很久”。o1 属于 OpenAI 的 O 系列推理模型,和传统模型最大的不同是:它们在生成答案前,会进行更长链路的内部推理,通常想得越久,答案越好。

但 Mark 也毫不避讳地指出了 o1 的致命短板:它不能用工具,尤其是不能上网。这直接导致一个荒谬的现实——模型逻辑再强,也被困在“断网状态”。而现实世界的大部分知识工作,恰恰依赖不断查资料、比对来源、追踪最新信息。

Deep Research 本质上就是对这个短板的正面回应。它不是简单地“加了个浏览插件”,而是一个能做多步网络研究的系统:先发现内容,再综合内容,最后对内容进行推理,而且在过程中可以动态调整计划。这种“边找边想、边想边改”的能力,才第一次让推理模型真正接上现实世界的信息流。

这不是搜索升级,而是“准研究员级”的输出

OpenAI 给 Deep Research 的一个关键定义是:它输出的不是答案,而是一份“完整、带引用的研究报告”。Mark 甚至直接说,这基本等同于一个分析师或领域专家交付的成果。

从演示和描述来看,它特别擅长三类事情:第一,极其具体、琐碎、需要大量人工搜索的问题;第二,需要跨多个来源整合的信息型任务;第三,把研究结果直接转化为可用内容,比如演示文稿的素材。

但 OpenAI 并没有把它包装成“不会出错的完美研究员”。Issa 在介绍底层时明确提醒:Deep Research 由即将发布的 O3 推理模型微调而来,训练方式是端到端强化学习,覆盖了高难度浏览和推理任务——但它依然可能 hallucinate。所以,当你真的要用它交报告、写决策材料,仍然需要你自己核查来源。

这个态度本身很值得玩味:OpenAI 已经不再承诺“正确性神话”,而是把 Deep Research 放在一个更现实的位置——它可以把你从 80% 的体力研究工作中解放出来,但最后 20% 的判断,仍然属于人。

一个被低估的信号:这是 AGI 路线图的一小步

如果只把 Deep Research 看成“ChatGPT 的一个新按钮”,那就太低估它了。Mark 在发布中明确把这件事和 AGI 路线图绑在了一起。

他说得很清楚:OpenAI 认为,模型必须学会在更长时间尺度上、以无人监督的方式完成任务。这是通向 AGI 的核心能力之一。终极目标,是一个能够自己发现、理解、甚至创造新知识的系统。

而 Deep Research,就是这个愿景的“第一块踏板”。它还只是在做“理解和综合互联网已有信息”,但它已经具备几个关键特征:长时间运行、自主规划、多步工具使用、最终产出结构化成果。

从这个视角看,允许模型慢慢想,其实不是产品妥协,而是战略选择。OpenAI 正在把 AI 从“回答问题的模型”,推向“完成任务的代理(Agent)”。

总结

Deep Research 释放的信号只有一个:AI 的价值重心,正在从“快不快”转向“能不能独立把事做完”。对从业者来说,这意味着两件事。第一,你未来的竞争力不在于“会不会查资料”,而在于如何提出好问题、验证好结果。第二,现在正是重新设计工作流的窗口期——把长时间、低创造性的研究任务交给 AI,把判断权和决策权留给自己。一个值得思考的问题是:当 AI 可以在后台连续工作 30 分钟甚至更久时,你的角色,是否也该随之升级?


关键词: Deep Research, AI Agent, 推理模型, OpenAI, AGI 路线图

事实核查备注: 需要核查:1)Deep Research 发布时间(2025-02-03)与 Pro/Plus/Team 的上线顺序;2)Deep Research 使用的是“即将发布的 O3 推理模型”的微调版本;3)模型可等待 5 到 30 分钟返回结果的官方表述;4)输出为“完整、带引用的研究报告”的原话语境。