OpenAI突然开源推理模型：GPTOSS不是情怀，是一张重新洗牌的底牌

AI PM 编辑部 · 2025年10月08日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都以为 OpenAI 会继续把最强模型牢牢攥在 API 里时，他们却拿出了 GPTOSS——能本地跑、能微调、还能离线推理的开源模型。这不是一次象征性的“开放姿态”，而是一次对开发者工作方式的正面回应。

当所有人都以为 OpenAI 会继续把最强模型牢牢攥在 API 里时，他们却拿出了 GPTOSS——能本地跑、能微调、还能离线推理的开源模型。这不是一次象征性的“开放姿态”，而是一次对开发者工作方式的正面回应。

这场名为《Building with Open Models》的分享，一开口就有点不对劲。不是讲 API 新特性，也不是云端算力升级，而是直接聊 OpenAI 在 2025 年 8 月发布的最新开源模型系列——GPTOSS。

要知道，过去几年 OpenAI 给行业留下的最深印象是“闭源、API、规模化”。而这一次，Dominic Kundal 站在台上，几乎是在替开发者把话说透了：“我们之所以做 GPTOSS，第一原因是——你们一直在问。”

这句话的信息量很大。它暗示了一件事：即便是 OpenAI，也不得不正视一个现实——开发者的真实世界，早就不是单一闭源模型能覆盖的。合规、本地部署、成本控制、可控推理，这些需求正在把‘开源模型’从备选方案，推到主舞台。

GPTOSS 是一个包含两款模型的开源家族，其中一款是 20B 级别的大模型。参数规模本身并不惊人，真正让现场观众抬头的是它的运行条件：单张 80GB 显存的 GPU 就能跑。

具体来说，无论是 NVIDIA 的 H100、AMD 的 MI300X，甚至是一台 128GB 内存的顶配 MacBook Pro，都在支持列表中。这背后的信号很明确——OpenAI 在刻意降低“高质量推理模型”的硬件门槛。

更关键的是定位。GPTOSS 被定义为 reasoning models（推理模型），而且提供可变推理强度和原始 chain-of-thought 访问能力。这在以往的闭源模型中，是极其敏感、也极其受限的能力。现在，它被放进了一个可以本地运行、可以自己掌控的模型里。

如果 GPTOSS 只是“给你一个模型权重”，那它的影响力会有限得多。但 OpenAI 显然不打算这么做。

在分享中，Dominic 明确强调：GPTOSS 可以直接接入 OpenAI 的 Agents SDK，可以通过 Codex CLI 使用，同时也在快速进入更广泛的开发者工具链——包括 Hugging Face、NVIDIA 相关生态，以及当天刚刚宣布支持的 LM Studio。

这一步非常关键。它意味着 GPTOSS 不是要取代闭源模型，而是和 GPT-4 级别的云端模型并存。开发者可以在同一个 Agent 架构下，灵活选择：哪些任务走云端最强模型，哪些任务留在本地，用 GPTOSS 处理敏感数据。

演示环节里，有一个细节非常值得反复回看。

Dominic 构建了一个金融 Agent，直接读取本地目录里的财务文件，完成分析、生成图表，整个过程——完全离线。本地运行，本地推理，数据一步都没有离开机器。

这不是炫技，这是现实需求。金融、医疗、企业内部系统，很多场景根本不允许数据出网。过去，这类需求要么牺牲模型能力，要么牺牲合规性。GPTOSS 给出的答案是：你不用二选一。

更有意思的是，即便是在较小 GPU 条件下，GPTOSS 依然可以完成诸如“生成 2024 年股票收益柱状图”这样的任务，响应速度也足够实用。

如果说本地运行解决的是“在哪用”，那微调解决的就是“为谁用”。

GPTOSS 支持开发者自行 fine-tuning。分享中展示了一个对比实验：基础模型 vs 微调后的模型，在多个对战式任务中，后者明显胜出。这意味着什么？意味着模型不再只是‘通用智能’，而是可以被塑造成真正贴合你业务的工具。

在结尾，Dominic 甚至略带自嘲地展示了 NVIDIA 的 DGX Spark 硬件——但随即点破重点：GPTOSS 的价值，不在某一台豪华设备，而在于‘你可以把模型跑在任何你需要的地方’。

GPTOSS 的出现，标志着 OpenAI 在战略上的一次明显转向：不再只押注云端最强模型，而是开始认真经营“开发者可控的智能”。

如果你是 AI 从业者，这件事至少有三个直接启发：第一，开源推理模型已经足够强，值得进入生产视野；第二，Agent 架构正在成为连接云端与本地的通用语言；第三，未来的竞争优势，很可能不在模型参数，而在你如何部署、微调并真正用好它。

一个值得思考的问题是：当 OpenAI 自己都在拥抱“可本地运行的开源模型”，你的技术路线，是否也该重新评估了？

关键词： GPTOSS， OpenAI，开源模型，本地部署， AI Agent

事实核查备注：需要核查：GPTOSS发布时间（2025年8月）、模型参数规模（20B）、支持硬件（H100、MI300X、128GB MacBook Pro）、生态支持列表（Agents SDK、Codex CLI、Hugging Face、LM Studio）、演示是否完全离线