o1正式发布与ChatGPT Pro：推理AI开始按价值定价

AI PM 编辑部 · 2024年12月07日 · 6 阅读 · AI/人工智能

Elon Musk AI应用机器学习语音AI 多模态代码生成生成式AI AI推理 AI Agent 大语言模型

正在加载视频...

视频章节

OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级，而是一次关于“推理能力如何定价、为谁而生”的重要实验，揭示了AI从通用助手走向研究级工具的分水岭。

o1正式发布与ChatGPT Pro：推理AI开始按价值定价

OpenAI在“12 Days of Shipmas”首日同时发布o1正式版与每月200美元的ChatGPT Pro订阅。这不是一次常规升级，而是一次关于“推理能力如何定价、为谁而生”的重要实验，揭示了AI从通用助手走向研究级工具的分水岭。

从预览到正式版：o1的进化不只是更快

为什么o1正式版重要？因为它标志着OpenAI首次将“推理”作为核心产品能力，而不是附属特性。视频中提到，OpenAI宣布“o1 is now out of preview”，并强调这是一个“faster， more powerful reasoning model”，在代码、数学和写作上都有明显提升。

具体变化非常实在：新版o1支持图像上传，使模型能够对视觉信息进行推理。OpenAI在演示中展示了两个案例：一个是基于单张图片，给出如何搭建鸟屋的详细步骤；另一个更硬核，模型根据一张示意图分析了太空数据中心的散热需求。这些并非噱头，而是展示o1如何把抽象推理能力延伸到多模态世界。

在性能指标上，官方给出了明确数字：在困难问题上，o1的“重大错误率”降低了34%。OpenAI发言人总结为一句话：“用户可以期待一个更快、更强、更准确的推理模型。”研究员Noam Brown还展示，o1不仅能通过著名的“草莓测试”，甚至能写出一篇三段式、不包含字母e的草莓主题短文。

值得注意的是，o1在部分高级基准（如衡量机器学习工程能力的MLE-bench）上成绩反而下降。视频中也坦率承认，目前存在“是否使用了早期构建版本进行测试”的疑问。这种不回避争议的态度，本身也是o1发布的一个真实注脚。

每月200美元的ChatGPT Pro：不是给所有人用的

如果说o1是技术拐点，那么ChatGPT Pro就是商业信号。OpenAI推出每月200美元的Pro订阅，第一反应往往是“太贵了”。但视频里OpenAI技术人员Jason Wei直言不讳：“We think the audience for ChatGPT Pro will be the power users.”

Pro的核心不是“无限使用”这么简单，而是包含了一种更重型的推理方式——o1 Pro mode（视频中也称PR mode）。这种模式“uses more compute for the best answers to the hardest questions”，允许模型思考更长时间，回答可能需要几分钟。OpenAI甚至明确，这是一条实验路径，他们计划探索“reason for hours， days， or even weeks”的模型。

在外部专家测试中，o1 Pro mode在数据科学、编程和判例法分析上，比o1和o1-preview“更可靠、更全面”。最夸张的数字出现在编程上：在更贴近日常工作的简单竞赛题中，错误率降低了75%。为了确保提升不是偶然，OpenAI提高了测试门槛：普通模型是“答对一次算通过”，而Pro mode必须“四次全对”。

这一切都指向一个清晰结论：ChatGPT Pro并不是升级版会员，而是一种“研究级算力+推理时间”的打包出售。

谁真的需要o1 Pro？一个教授的“真实试用记”

判断一款AI产品是否成立，往往不在发布会，而在真实用户的挫败与惊喜中。视频里引用了MIT教授Ethan Mollick（视频中称Ethan Mik）的一整天实测体验。他的评价很克制：“They are very good and a little weird… not for most people most of the time.”

他发现，只有当你真的有“特别难的问题”时，o1和o1 Pro才会体现价值。这些问题往往是高价值的：系统设计、复杂问题求解、金融分析等。在这些场景下，“the value will clearly be higher than the price”。

更有趣的是他的实验细节：o1 Pro不仅能处理严肃研究，还能完成一些看似荒诞的任务，比如设计一台“由成群螃蟹构成逻辑门的图灵机”，灵感来自一篇2021年的论文。这种跨领域、长链路规划能力，正是Mollick认为o1在“复杂情节规划”上有时优于Claude 3.5 Sonnet的原因。

但他也明确指出边界：o1“不是更好的写作者”。在大多数日常任务上，他依然更多使用Sonnet、GPT‑4o或Gemini。只有当这些模型失败时，o1 Pro“can sometimes crack things that the other models cannot”。这不是全面替代，而是工具箱中的一把重锤。

按价值而非规模收费，可能是AI产业的必经之路

围绕200美元定价的争论，其实指向一个更大的问题：AI应该如何收费？视频中引用了多位从业者的直观判断。有人说：“If o1 Pro can help quant or ML engineers solve problems even 5% faster， then it's a bargain.” 对高薪专业人士而言，这几乎可以忽略不计。

Lightell Energy的Danielle Fong一句话更具传播力：“Just hired a new intern at $200 a month.” 她随即补充，这样的“intern”可能同时打好几份工——而这“似乎正是重点”。

也有人担心这会开启AI产品不断涨价的先例。但Adam Silverman给出了相反的看法：他希望OpenAI的定价“will be a catalyst for AI and agent companies to start charging more”，从而让商业模式真正支撑长期进步。

把视角拉远，视频最后顺带提到Elon Musk的xAI完成了60亿美元融资，全年融资达114亿美元。资金、算力、定价权，正在同时向少数“能交付硬价值”的模型集中。o1和ChatGPT Pro，很可能只是这个阶段的第一个清晰信号。

总结

o1正式版和ChatGPT Pro并不是为了取悦所有人，而是明确告诉市场：真正稀缺的是高难度推理能力和可验证的可靠性。对普通用户而言，现有模型已经足够；但对科研、工程和金融等高价值场景，o1 Pro展示了一种全新的可能性——AI开始像高级专家一样按价值而非流量定价。这也许正是下一阶段AI竞争的核心。

关键词： OpenAI， o1模型， ChatGPT Pro， AI推理，生成式AI

事实核查备注：关键事实核查点：1）模型名称：OpenAI o1、o1-preview、o1 Pro mode（PR mode）；2）订阅价格：ChatGPT Pro为200美元/月；3）性能数据：重大错误率降低34%，简单编程题错误率降低75%；4）人物与引语：Jason Wei、Noam Brown、Ethan Mollick（视频中称Ethan Mik）、Danielle Fong、Adam Silverman；5）多模态演示案例：鸟屋建造、太空数据中心散热分析；6）xAI融资数据：本轮60亿美元，全年114亿美元。

返回文章列表