OpenAI 扔掉“秒回”：Deep Research 为什么敢让 AI 想30分钟

AI PM 编辑部 · 2025年02月03日 · 10 阅读 · AI/人工智能

AI推理微调大语言模型强化学习 AI Agent 通用人工智能无监督学习 ChatGPT o1 OpenAI

正在加载视频...

视频章节

OpenAI 在东京发布了一个反直觉的新能力：AI 不再追求“快”，而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新，而是一次对“AI 应该怎么工作”的彻底改写。

OpenAI 扔掉“秒回”：Deep Research 为什么敢让 AI 想30分钟

OpenAI 在东京发布了一个反直觉的新能力：AI 不再追求“快”，而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新，而是一次对“AI 应该怎么工作”的彻底改写。

最反直觉的决定：OpenAI 主动放弃“低延迟”

在大多数 AI 产品还在卷“毫秒级响应”的时候，OpenAI 却在发布会上公开承认：Deep Research 可能要等 5 分钟，甚至 30 分钟才给你答案，而且他们认为这是“好事”。这句话本身就足够炸裂。

Mark 在介绍时讲得很直白：传统模型被默认要求“尽快给答案”，但真正高质量的研究，本来就不可能是秒级完成的。Deep Research 的定位不是聊天，而是“让模型像分析师一样工作”。这意味着它可以慢慢浏览网页、发现新线索、调整搜索路径，而不是一次性拍脑袋。

这背后其实是一个产品哲学的转向：OpenAI 不再把所有 AI 都当成“即时对话工具”，而是开始认真对待“长时间自主任务”。从这个角度看，Deep Research 更像是一个可以被放在后台跑的研究助理，而不是一个等着你追问的聊天机器人。

从 o1 到 Deep Research：推理模型终于拿到“浏览器”

如果你还记得 o1，会知道它最大的卖点是“会想很久”。o1 属于 OpenAI 的 O 系列推理模型，和传统模型最大的不同是：它们在生成答案前，会进行更长链路的内部推理，通常想得越久，答案越好。

但 Mark 也毫不避讳地指出了 o1 的致命短板：它不能用工具，尤其是不能上网。这直接导致一个荒谬的现实——模型逻辑再强，也被困在“断网状态”。而现实世界的大部分知识工作，恰恰依赖不断查资料、比对来源、追踪最新信息。

Deep Research 本质上就是对这个短板的正面回应。它不是简单地“加了个浏览插件”，而是一个能做多步网络研究的系统：先发现内容，再综合内容，最后对内容进行推理，而且在过程中可以动态调整计划。这种“边找边想、边想边改”的能力，才第一次让推理模型真正接上现实世界的信息流。

这不是搜索升级，而是“准研究员级”的输出

OpenAI 给 Deep Research 的一个关键定义是：它输出的不是答案，而是一份“完整、带引用的研究报告”。Mark 甚至直接说，这基本等同于一个分析师或领域专家交付的成果。

从演示和描述来看，它特别擅长三类事情：第一，极其具体、琐碎、需要大量人工搜索的问题；第二，需要跨多个来源整合的信息型任务；第三，把研究结果直接转化为可用内容，比如演示文稿的素材。

但 OpenAI 并没有把它包装成“不会出错的完美研究员”。Issa 在介绍底层时明确提醒：Deep Research 由即将发布的 O3 推理模型微调而来，训练方式是端到端强化学习，覆盖了高难度浏览和推理任务——但它依然可能 hallucinate。所以，当你真的要用它交报告、写决策材料，仍然需要你自己核查来源。

这个态度本身很值得玩味：OpenAI 已经不再承诺“正确性神话”，而是把 Deep Research 放在一个更现实的位置——它可以把你从 80% 的体力研究工作中解放出来，但最后 20% 的判断，仍然属于人。

一个被低估的信号：这是 AGI 路线图的一小步

如果只把 Deep Research 看成“ChatGPT 的一个新按钮”，那就太低估它了。Mark 在发布中明确把这件事和 AGI 路线图绑在了一起。

他说得很清楚：OpenAI 认为，模型必须学会在更长时间尺度上、以无人监督的方式完成任务。这是通向 AGI 的核心能力之一。终极目标，是一个能够自己发现、理解、甚至创造新知识的系统。

而 Deep Research，就是这个愿景的“第一块踏板”。它还只是在做“理解和综合互联网已有信息”，但它已经具备几个关键特征：长时间运行、自主规划、多步工具使用、最终产出结构化成果。

从这个视角看，允许模型慢慢想，其实不是产品妥协，而是战略选择。OpenAI 正在把 AI 从“回答问题的模型”，推向“完成任务的代理（Agent）”。

总结

Deep Research 释放的信号只有一个：AI 的价值重心，正在从“快不快”转向“能不能独立把事做完”。对从业者来说，这意味着两件事。第一，你未来的竞争力不在于“会不会查资料”，而在于如何提出好问题、验证好结果。第二，现在正是重新设计工作流的窗口期——把长时间、低创造性的研究任务交给 AI，把判断权和决策权留给自己。一个值得思考的问题是：当 AI 可以在后台连续工作 30 分钟甚至更久时，你的角色，是否也该随之升级？

关键词： Deep Research， AI Agent，推理模型， OpenAI， AGI 路线图

事实核查备注：需要核查：1）Deep Research 发布时间（2025-02-03）与 Pro/Plus/Team 的上线顺序；2）Deep Research 使用的是“即将发布的 O3 推理模型”的微调版本；3）模型可等待 5 到 30 分钟返回结果的官方表述；4）输出为“完整、带引用的研究报告”的原话语境。

返回文章列表