o1正式发布与ChatGPT Pro:推理AI开始按价值定价
正在加载视频...
视频章节
OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级,而是一次关于“推理能力如何定价、为谁而生”的重要实验,揭示了AI从通用助手走向研究级工具的分水岭。
o1正式发布与ChatGPT Pro:推理AI开始按价值定价
OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级,而是一次关于“推理能力如何定价、为谁而生”的重要实验,揭示了AI从通用助手走向研究级工具的分水岭。
从预览到正式版:o1的进化不只是更快
为什么o1正式版重要?因为它标志着OpenAI首次将“推理”作为核心产品能力,而不是附属特性。视频中提到,OpenAI宣布“o1 is now out of preview”,并强调这是一个“faster, more powerful reasoning model”,在代码、数学和写作上都有明显提升。
具体变化非常实在:新版o1支持图像上传,使模型能够对视觉信息进行推理。OpenAI在演示中展示了两个案例:一个是基于单张图片,给出如何搭建鸟屋的详细步骤;另一个更硬核,模型根据一张示意图分析了太空数据中心的散热需求。这些并非噱头,而是展示o1如何把抽象推理能力延伸到多模态世界。
在性能指标上,官方给出了明确数字:在困难问题上,o1的“重大错误率”降低了34%。OpenAI发言人总结为一句话:“用户可以期待一个更快、更强、更准确的推理模型。”研究员Noam Brown还展示,o1不仅能通过著名的“草莓测试”,甚至能写出一篇三段式、不包含字母e的草莓主题短文。
值得注意的是,o1在部分高级基准(如衡量机器学习工程能力的MLE-bench)上成绩反而下降。视频中也坦率承认,目前存在“是否使用了早期构建版本进行测试”的疑问。这种不回避争议的态度,本身也是o1发布的一个真实注脚。
每月200美元的ChatGPT Pro:不是给所有人用的
如果说o1是技术拐点,那么ChatGPT Pro就是商业信号。OpenAI推出每月200美元的Pro订阅,第一反应往往是“太贵了”。但视频里OpenAI技术人员Jason Wei直言不讳:“We think the audience for ChatGPT Pro will be the power users.”
Pro的核心不是“无限使用”这么简单,而是包含了一种更重型的推理方式——o1 Pro mode(视频中也称PR mode)。这种模式“uses more compute for the best answers to the hardest questions”,允许模型思考更长时间,回答可能需要几分钟。OpenAI甚至明确,这是一条实验路径,他们计划探索“reason for hours, days, or even weeks”的模型。
在外部专家测试中,o1 Pro mode在数据科学、编程和判例法分析上,比o1和o1-preview“更可靠、更全面”。最夸张的数字出现在编程上:在更贴近日常工作的简单竞赛题中,错误率降低了75%。为了确保提升不是偶然,OpenAI提高了测试门槛:普通模型是“答对一次算通过”,而Pro mode必须“四次全对”。
这一切都指向一个清晰结论:ChatGPT Pro并不是升级版会员,而是一种“研究级算力+推理时间”的打包出售。
谁真的需要o1 Pro?一个教授的“真实试用记”
判断一款AI产品是否成立,往往不在发布会,而在真实用户的挫败与惊喜中。视频里引用了MIT教授Ethan Mollick(视频中称Ethan Mik)的一整天实测体验。他的评价很克制:“They are very good and a little weird… not for most people most of the time.”
他发现,只有当你真的有“特别难的问题”时,o1和o1 Pro才会体现价值。这些问题往往是高价值的:系统设计、复杂问题求解、金融分析等。在这些场景下,“the value will clearly be higher than the price”。
更有趣的是他的实验细节:o1 Pro不仅能处理严肃研究,还能完成一些看似荒诞的任务,比如设计一台“由成群螃蟹构成逻辑门的图灵机”,灵感来自一篇2021年的论文。这种跨领域、长链路规划能力,正是Mollick认为o1在“复杂情节规划”上有时优于Claude 3.5 Sonnet的原因。
但他也明确指出边界:o1“不是更好的写作者”。在大多数日常任务上,他依然更多使用Sonnet、GPT‑4o或Gemini。只有当这些模型失败时,o1 Pro“can sometimes crack things that the other models cannot”。这不是全面替代,而是工具箱中的一把重锤。
按价值而非规模收费,可能是AI产业的必经之路
围绕200美元定价的争论,其实指向一个更大的问题:AI应该如何收费?视频中引用了多位从业者的直观判断。有人说:“If o1 Pro can help quant or ML engineers solve problems even 5% faster, then it's a bargain.” 对高薪专业人士而言,这几乎可以忽略不计。
Lightell Energy的Danielle Fong一句话更具传播力:“Just hired a new intern at $200 a month.” 她随即补充,这样的“intern”可能同时打好几份工——而这“似乎正是重点”。
也有人担心这会开启AI产品不断涨价的先例。但Adam Silverman给出了相反的看法:他希望OpenAI的定价“will be a catalyst for AI and agent companies to start charging more”,从而让商业模式真正支撑长期进步。
把视角拉远,视频最后顺带提到Elon Musk的xAI完成了60亿美元融资,全年融资达114亿美元。资金、算力、定价权,正在同时向少数“能交付硬价值”的模型集中。o1和ChatGPT Pro,很可能只是这个阶段的第一个清晰信号。
总结
o1正式版和ChatGPT Pro并不是为了取悦所有人,而是明确告诉市场:真正稀缺的是高难度推理能力和可验证的可靠性。对普通用户而言,现有模型已经足够;但对科研、工程和金融等高价值场景,o1 Pro展示了一种全新的可能性——AI开始像高级专家一样按价值而非流量定价。这也许正是下一阶段AI竞争的核心。
关键词: OpenAI, o1模型, ChatGPT Pro, AI推理, 生成式AI
事实核查备注: 关键事实核查点:1)模型名称:OpenAI o1、o1-preview、o1 Pro mode(PR mode);2)订阅价格:ChatGPT Pro为200美元/月;3)性能数据:重大错误率降低34%,简单编程题错误率降低75%;4)人物与引语:Jason Wei、Noam Brown、Ethan Mollick(视频中称Ethan Mik)、Danielle Fong、Adam Silverman;5)多模态演示案例:鸟屋建造、太空数据中心散热分析;6)xAI融资数据:本轮60亿美元,全年114亿美元。