OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

AI PM 编辑部 · 2025年11月21日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

在Google Gemini 3发布前后,OpenAI出人意料地密集推出GPT 5.1、5.1 Pro和全新的Codex Max。本篇文章还原这场“地震周”的关键细节,解释这些模型为何不仅是产品更新,更可能改变AI代理、代码生成和通用AI的时间表。

OpenAI连发5.1与Codex Max:一周之内重塑AI竞赛叙事

在Google Gemini 3发布前后,OpenAI出人意料地密集推出GPT 5.1、5.1 Pro和全新的Codex Max。本篇文章还原这场“地震周”的关键细节,解释这些模型为何不仅是产品更新,更可能改变AI代理、代码生成和通用AI的时间表。

一场“没人预料到”的连环发布,为何如此重要

这一周之所以不同寻常,首先在于节奏。视频一开始,主持人就感叹这是“a hell of a week”,而这种情绪并不夸张。GPT 5.1的发布本身就已经是意外——“frankly no one was really expecting”。在此之前,外界的注意力几乎都集中在即将发布的Gemini 3上。

5.1并不是一次象征性的小升级。演讲者明确强调,这是一次“major update”,其中一个直观变化是模型“带回了更多个性”。这句话背后,其实点出了用户过去一段时间对模型“变冷”“变模板化”的隐约不满。OpenAI显然意识到,竞争已经不仅是参数规模,而是体验与可用性的综合博弈。

更关键的是时间点。5.1的快速推出,让人意识到OpenAI“知道Gemini 3很快就要来了”。这不只是回应对手,而是一种提前卡位的信号:在叙事层面,OpenAI不愿意把“这一周的主角”完全让给Google。

Codex Max:从写代码到试验通用智能的试验田

如果说5.1 Pro是面向所有人的升级,那么真正被内部押注的,可能是新的编码模型——GPT51 Codex Max。OpenAI在公告中写道,它“built on an update to our foundational reasoning model”,也就是说,这并不是简单的代码补全工具,而是推理能力的直接延伸。

一个极具说服力的故事来自内部使用数据:OpenAI声称,95%的工程师每周都会使用Codex,而使用它的工程师,提交的pull request数量“roughly 70% more”。这不是营销口径,而是效率跃迁的量化证据。

研究员Nome Brown借机强化了一个贯穿全周的判断:在“meter test”上,Agent能力的时间窗口仍在“roughly every 7 months doubling”。换句话说,Codex Max里的许多创新,本质上是在为未来的通用AI做代理能力演练——先在代码这个高反馈场景中验证,再推广到更广泛的任务。

5.1 Pro的真实体验:为什么有人说它是“怪物”

除了Codex Max,另一条暗线是GPT 5.1 Pro。评论员Simon Willis指出,尽管编码模型吸走了不少注意力,但“bigger news may actually be GPT5 Pro”。这种判断,很快被一条更直白的体验反馈放大。

Matt Schumer几乎没有修饰自己的感受:“I've had access to GPT51 Pro for the last week. It's an effing monster.” 这句话之所以被反复引用,是因为它来自真实使用,而不是基准测试。演讲者补充道,OpenAI一直在逼近一个目标——让模型不仅回答问题,而是真正承担复杂工作。

在他看来,5.1 Pro意味着AI在2026年“doing even more impactful work”已经不再是幻想。这种乐观并非来自某个单点功能,而是整体能力的叠加:推理、上下文保持、以及更稳定的输出质量。

从OpenAI到Google:这一周如何重塑行业叙事

拉远视角看,表面故事是“OpenAI在Google想用Gemini 3主导话题的一周里强势反击”。但更深层的变化,是整个行业叙事的校准。投资人Gavin Baker指出,Gemini 3的意义在于证明了一件事:预训练的scaling laws依然成立。

这对过去一年里不断出现的怀疑论,是一次集体回应。演讲者形容这一幕时说,几乎所有模型公司——包括OpenAI、Google,甚至提到的Grock 41——“standing shoulder-to-shoulder”,对外界传达同一个信息:别急,“just wait to see what comes next”。

这意味着,短期内不会迎来增长停滞,相反,模型能力的上限仍在被不断推高。而5.1、Codex Max和Gemini 3,正是这一趋势的连续注脚。

总结

这一周的密集发布,并不只是新模型列表的更新,而是一次对AI未来节奏的公开表态:能力仍在快速跃迁,Agent化路径正在加速,预训练的潜力远未耗尽。对读者而言,真正值得关注的不是某一个型号,而是这些模型已经开始承担“真实工作”的事实。2026年,很可能比我们想象得来得更快。


关键词: GPT 5.1, Codex Max, AI Agent, 预训练Scaling Laws, OpenAI与Google

事实核查备注: 视频中提及的关键事实包括:GPT 5.1为一次重大更新;GPT 5.1 Pro已向部分用户开放;GPT51 Codex Max基于更新后的基础推理模型;OpenAI称95%的工程师每周使用Codex,使用者PR数量约提升70%;Nome Brown提出Agent能力时间窗口约每7个月翻倍;Matt Schumer评价GPT 5.1 Pro为“effing monster”;Gavin Baker认为Gemini 3证明预训练scaling laws依然成立。