OpenAI DevDay 2024 没发布 GPT-5，却悄悄改写了开发者的未来

AI PM 编辑部 · 2024年12月17日 · 3 阅读 · AI/人工智能

Sam Altman Embedding 多模态 AI推理 AI应用微调提示工程 Token 蒸馏语音AI

正在加载视频...

视频章节

所有人都在等 GPT-5，OpenAI 却在 DevDay 2024 上选择了另一条路：不拼参数规模，而是把“推理、语音、成本和代理”真正交到开发者手里。这场看似克制的发布，实际上比任何一次模型升级都更激进。

OpenAI DevDay 2024 没发布 GPT-5，却悄悄改写了开发者的未来

所有人都在等 GPT-5，OpenAI 却在 DevDay 2024 上选择了另一条路：不拼参数规模，而是把“推理、语音、成本和代理”真正交到开发者手里。这场看似克制的发布，实际上比任何一次模型升级都更激进。

没有 GPT-5 的 DevDay，反而更危险

当 Olivier 站上台，第一句话就先“拆弹”——“我不是 Sam，我也不会发布 GPT-5”。这句话并不是降温，而是定调：OpenAI 这次不想再靠一个更大的模型震撼你。

真正反直觉的是，DevDay 2024 的所有发布，几乎都在回答同一个问题：如果模型不再线性变大，AI 还能怎么继续变强？

答案不是参数，而是“推理方式、交互形态和规模化路径”。从 GPT-3 时代的幻觉、延迟，到如今百万开发者在真实世界跑应用，OpenAI 很清楚一件事：模型已经够聪明了，瓶颈在“怎么用、怎么控、怎么便宜地用”。

o1：OpenAI 第一次把“思考过程”当成产品卖

o1 系列，是这次 DevDay 最重要、也最容易被低估的发布。

OpenAI 直接承认：o1 不是 GPT-4o 的替代品。它更慢、更贵，但更会“想”。o1-preview 面向深度推理问题，o1-mini 则服务于调试、Agent 和高频调用场景。

关键变化在于：推理不再是模型的隐性能力，而是可以被工程化、被调用、被优化的资源。

在演示中，o1 能清晰拆解复杂逻辑问题，展示逐步推理路径，并在法律分析、代码规划等任务上明显优于 GPT-4o。Cognition 用它做自治编程代理，Casetext + Thomson Reuters 用它做法律推理——这些都不是 Demo，而是已经跑在真实业务里的用例。

这释放了一个强烈信号：AI Agent 的上限，不再只由“模型聪不聪明”决定，而是由“你是否愿意为关键步骤付出推理成本”决定。

从写代码到飞无人机：o1 把 Agent 拉进现实

如果说 o1 的介绍偏理论，那 Roman 的两场 Demo 则非常“残忍”。

第一场，他用 o1 从 0 开始规划并实现一个 iPhone 的 ISS 实时追踪 App：需求拆解、架构设计、API 选择、部署路径，几乎全流程由模型主导。

第二场更夸张：o1-mini 被用来构建一个无人机控制系统。前端 React、WebSockets 通信、后端逻辑，再到最后的实体无人机起飞。

这里真正重要的不是“AI 会写代码”，而是：模型已经开始承担“系统级规划者”的角色。它不只是补函数，而是在决定组件如何协作、状态如何流动、失败时如何回退。

这也是 OpenAI 强调的一个现实提醒：o1 不能乱用。真正好的系统，是 GPT-4o 负责高频对话和多模态输入，o1 只在“必须思考”的节点介入。

Realtime API：语音不再是功能，而是默认交互

如果说 o1 改变的是“AI 怎么想”，Realtime API 改变的则是“AI 怎么说话”。

Realtime API 本质上是 ChatGPT 高级语音模式的开发者版：WebSocket 直连、低延迟、支持打断、支持函数调用、支持结构化输出。

Roman 在 Playground 里做了一个让现场沸腾的 Demo：一个 Wanderlust 旅行助手，能边对话边操作地图，最后甚至通过 Twilio 打电话订草莓。

更重要的是，OpenAI 已经有真实用户在跑这套系统：Healthify 用它做健康教练，Speak 用它做实时语言学习和发音反馈。

这意味着一个趋势已经很明确：未来的 AI 应用，语音不是加分项，而是默认入口。键盘反而成了“专家模式”。

真正被低估的发布：成本、缓存和模型蒸馏

DevDay 最容易被忽略的，是最后一部分“看起来不性感”的发布。

几个数字值得所有开发者记住：自 GPT-3.5 以来，Token 成本下降了 99%。Prompt Caching 可以对重复输入自动打 5 折。模型蒸馏工具，让你用大模型的输出训练更小、更快、更便宜的模型。

再加上 GPT-4o 的视觉微调能力——Grab 只用了 100 张标注图片，就在推荐和识别任务上取得了非常强的效果。

这些组合在一起，指向一个非常现实的未来：真正跑得久的 AI 产品，一定是“混合模型 + 成本工程 + 精细评估”的产物，而不是单一大模型的炫技。

总结

这场 DevDay 没有给我们一个“更大的奇迹模型”，却给了开发者一整套更残酷、也更真实的工具箱：你必须学会在不同模型之间做取舍，学会为推理付费，学会把语音当成主入口，学会用缓存和蒸馏活下去。

如果你是开发者，现在就该问自己三个问题：哪些环节真的需要 o1 的深度推理？我的产品是否可以用语音重做一遍？我是否已经在为规模化提前做成本设计？

OpenAI 已经把方向摊开了，接下来拼的，不是模型，而是你怎么用。

关键词： OpenAI DevDay 2024， o1 推理模型， Realtime API， AI Agent，多模态与语音AI

事实核查备注：需要核查：1）DevDay 2024 实际时长与日期（2024-12-17）；2）o1-preview 与 o1-mini 的官方定位描述；3）Realtime API 是否为 public beta 当天开放；4）Token 成本下降 99% 的对比基准（GPT-3.5）；5）Grab 使用 100 张图片进行 GPT-4o 视觉微调的示例表述。

返回文章列表