OpenAI突然开源推理模型:GPTOSS不是情怀,是一张重新洗牌的底牌
正在加载视频...
视频章节
当所有人都以为 OpenAI 会继续把最强模型牢牢攥在 API 里时,他们却拿出了 GPTOSS——能本地跑、能微调、还能离线推理的开源模型。这不是一次象征性的“开放姿态”,而是一次对开发者工作方式的正面回应。
OpenAI突然开源推理模型:GPTOSS不是情怀,是一张重新洗牌的底牌
当所有人都以为 OpenAI 会继续把最强模型牢牢攥在 API 里时,他们却拿出了 GPTOSS——能本地跑、能微调、还能离线推理的开源模型。这不是一次象征性的“开放姿态”,而是一次对开发者工作方式的正面回应。
最反直觉的一幕:OpenAI开始认真“放权”了
这场名为《Building with Open Models》的分享,一开口就有点不对劲。不是讲 API 新特性,也不是云端算力升级,而是直接聊 OpenAI 在 2025 年 8 月发布的最新开源模型系列——GPTOSS。
要知道,过去几年 OpenAI 给行业留下的最深印象是“闭源、API、规模化”。而这一次,Dominic Kundal 站在台上,几乎是在替开发者把话说透了:“我们之所以做 GPTOSS,第一原因是——你们一直在问。”
这句话的信息量很大。它暗示了一件事:即便是 OpenAI,也不得不正视一个现实——开发者的真实世界,早就不是单一闭源模型能覆盖的。合规、本地部署、成本控制、可控推理,这些需求正在把‘开源模型’从备选方案,推到主舞台。
GPTOSS到底是什么?重点不在参数,而在“能跑在哪”
GPTOSS 是一个包含两款模型的开源家族,其中一款是 20B 级别的大模型。参数规模本身并不惊人,真正让现场观众抬头的是它的运行条件:单张 80GB 显存的 GPU 就能跑。
具体来说,无论是 NVIDIA 的 H100、AMD 的 MI300X,甚至是一台 128GB 内存的顶配 MacBook Pro,都在支持列表中。这背后的信号很明确——OpenAI 在刻意降低“高质量推理模型”的硬件门槛。
更关键的是定位。GPTOSS 被定义为 reasoning models(推理模型),而且提供可变推理强度和原始 chain-of-thought 访问能力。这在以往的闭源模型中,是极其敏感、也极其受限的能力。现在,它被放进了一个可以本地运行、可以自己掌控的模型里。
它不是孤岛:GPTOSS被塞进了整个OpenAI生态
如果 GPTOSS 只是“给你一个模型权重”,那它的影响力会有限得多。但 OpenAI 显然不打算这么做。
在分享中,Dominic 明确强调:GPTOSS 可以直接接入 OpenAI 的 Agents SDK,可以通过 Codex CLI 使用,同时也在快速进入更广泛的开发者工具链——包括 Hugging Face、NVIDIA 相关生态,以及当天刚刚宣布支持的 LM Studio。
这一步非常关键。它意味着 GPTOSS 不是要取代闭源模型,而是和 GPT-4 级别的云端模型并存。开发者可以在同一个 Agent 架构下,灵活选择:哪些任务走云端最强模型,哪些任务留在本地,用 GPTOSS 处理敏感数据。
真正打中痛点的,是“完全离线的Agent”
演示环节里,有一个细节非常值得反复回看。
Dominic 构建了一个金融 Agent,直接读取本地目录里的财务文件,完成分析、生成图表,整个过程——完全离线。本地运行,本地推理,数据一步都没有离开机器。
这不是炫技,这是现实需求。金融、医疗、企业内部系统,很多场景根本不允许数据出网。过去,这类需求要么牺牲模型能力,要么牺牲合规性。GPTOSS 给出的答案是:你不用二选一。
更有意思的是,即便是在较小 GPU 条件下,GPTOSS 依然可以完成诸如“生成 2024 年股票收益柱状图”这样的任务,响应速度也足够实用。
最后一击:它还能被你“改造成你自己的模型”
如果说本地运行解决的是“在哪用”,那微调解决的就是“为谁用”。
GPTOSS 支持开发者自行 fine-tuning。分享中展示了一个对比实验:基础模型 vs 微调后的模型,在多个对战式任务中,后者明显胜出。这意味着什么?意味着模型不再只是‘通用智能’,而是可以被塑造成真正贴合你业务的工具。
在结尾,Dominic 甚至略带自嘲地展示了 NVIDIA 的 DGX Spark 硬件——但随即点破重点:GPTOSS 的价值,不在某一台豪华设备,而在于‘你可以把模型跑在任何你需要的地方’。
总结
GPTOSS 的出现,标志着 OpenAI 在战略上的一次明显转向:不再只押注云端最强模型,而是开始认真经营“开发者可控的智能”。
如果你是 AI 从业者,这件事至少有三个直接启发:第一,开源推理模型已经足够强,值得进入生产视野;第二,Agent 架构正在成为连接云端与本地的通用语言;第三,未来的竞争优势,很可能不在模型参数,而在你如何部署、微调并真正用好它。
一个值得思考的问题是:当 OpenAI 自己都在拥抱“可本地运行的开源模型”,你的技术路线,是否也该重新评估了?
关键词: GPTOSS, OpenAI, 开源模型, 本地部署, AI Agent
事实核查备注: 需要核查:GPTOSS发布时间(2025年8月)、模型参数规模(20B)、支持硬件(H100、MI300X、128GB MacBook Pro)、生态支持列表(Agents SDK、Codex CLI、Hugging Face、LM Studio)、演示是否完全离线