GPT‑4.5不是最强模型，却可能最像“一个人”

AI PM 编辑部 · 2025年02月28日 · 11 阅读 · AI/人工智能

Sam Altman Andrej Karpathy 蒸馏幻觉 AI应用预训练 GPU 推理无监督学习生成式AI

正在加载视频...

视频章节

GPT‑4.5的发布没有刷新推理榜单，却引发了强烈的情绪化讨论。本篇文章还原The AI Daily Brief的核心判断：这是一款以“感觉”和创造力取胜的模型，代表了OpenAI在无监督预训练上的一次极限尝试，也揭示了未来模型分工的新方向。

GPT‑4.5不是最强模型，却可能最像“一个人”

GPT‑4.5的发布没有刷新推理榜单，却引发了强烈的情绪化讨论。本篇文章还原The AI Daily Brief的核心判断：这是一款以“感觉”和创造力取胜的模型，代表了OpenAI在无监督预训练上的一次极限尝试，也揭示了未来模型分工的新方向。

一场并不追求赢榜单的发布，反而更耐人寻味

为什么GPT‑4.5明明被高调发布，却又被OpenAI反复强调“不是Frontier Model”？这正是这次发布最反常、也最值得关注的地方。The AI Daily Brief指出，OpenAI已经明确：在GPT‑4.5之后，将迎来GPT‑5或其等价物，一个“推理模型（O系列）与GPT系列完全混合”的时代。换句话说，4.5并不是冲着终局去的。

更反常的是定位。GPT‑4.5在多项准备度评估中，明确落后于o1、o1‑mini以及Deep Research，甚至无法完全替代GPT‑4o——比如它没有语音模式。这在以往OpenAI的版本演进中几乎没有先例。主持人直言：这不是一次性能升级，而是一种“方向展示”。

OpenAI在白皮书中写得很清楚：GPT‑4.5“没有引入全新的前沿能力”，但却站在“超大规模无监督学习”的最前沿。这意味着，它的价值并不在推理能力，而在预训练所能带来的另一种智能形态。

“Vibes”成为关键词：OpenAI在押注什么？

在官方公告中，OpenAI几乎没有强调参数、准确率或推理链，而是反复提到一个模糊却真实的词：感觉。公告写道，早期测试显示，与GPT‑4.5的互动“更自然”，拥有更强的用户意图理解能力和更高的EQ，适合写作、编程和实际问题解决。

The AI Daily Brief将这种变化总结为：我们已经进入“Vibes”的时代。GPT‑4.5在人类评测中，被普遍认为比GPT‑4o更适合“日常专业和创意查询”，同时还表现出更低的幻觉率（hallucination）。在一个示例中，面对情绪低谷的用户，GPT‑4.5给出了明显更具同理心的回应，这种差异无法用传统benchmark衡量，却极易被人感知。

Sam Altman在个人帖子中写道：“这是第一个让我感觉像是在和一个体贴的人对话的模型。”他坦言，自己曾多次因为AI给出的建议而“坐在椅子上感到震惊”。这句话几乎定义了GPT‑4.5存在的理由。

写作能力的断层式提升：一个恐怖故事的对比

如果说GPT‑4.5有什么几乎一致被认可的优势，那就是写作。多位教授和开发者的反馈非常相似：它“写得漂亮、极有创造力”，但在复杂工程任务上反而显得有些“懒”。有人形容，这就像一个“更成熟的大脑”，单位字数里信息密度更高。

一个被反复引用的例子来自Ben Hilac。他用同一个“恐怖短篇故事”的提示词，分别测试GPT‑4o和GPT‑4.5。结果是，4.5生成的故事明显更原创、更生动、也更令人不安。他的结论非常直接：“这甚至不是一个接近的比较，这是第一次让我觉得用AI写作真的感觉很好。”

前OpenAI联合创始人Andrej Karpathy从更宏观的角度解释了这种差异。他认为GPT‑4.5不是推理模型，而是在EQ而非IQ任务上全面进化——包括世界知识、幽默感、类比能力和创意表达。在他展示的五组写作对比（讽刺、诗歌、想象任务）中，GPT‑4.5在投票中大多胜出。

昂贵、稀缺、也可能是一次“过渡性实验”

负面声音几乎全部集中在一个问题上：成本。GPT‑4.5的API定价高达每百万输入token 75美元、输出token 150美元，显著高于o1‑mini或Google Gemini。这让不少开发者怀疑，它是否在刻意抑制规模化使用，甚至不鼓励蒸馏。

更微妙的是OpenAI自己的态度。在一份官方说明中，公司表示GPT‑4.5“计算密集、成本高昂，并非GPT‑4o的替代品”，同时仍在评估是否长期提供API支持。这被Andrew Curran解读为：GPT‑4.5可能主要是为ChatGPT直面消费者而存在，而非一个稳定的开发者基座。

Sam Altman也承认了现实限制：“这是一个巨大而昂贵的模型……我们现在GPU不够。”他强调，4.5不会“碾压benchmark”，但代表了一种“不同类型的智能，一种新的魔法”。从这个角度看，它更像一次为GPT‑5探路的实验。

总结

The AI Daily Brief给出的最终判断非常清醒：不同模型将各司其职，就像“街头智慧”和“书本智慧”并存。GPT‑4.5也许不会成为最强推理引擎，却可能重新定义高质量写作和创意表达的标准。对普通用户和内容创作者而言，减少“AI味道”本身就是巨大的生产力提升。而对行业来说，这次发布透露的信号是：在通往GPT‑5之前，OpenAI正在认真探索，什么才是真正“像人”的智能。

关键词： GPT-4.5， OpenAI，无监督学习，生成式AI写作，模型定位

事实核查备注：关键事实核查点：1）GPT‑4.5定价：$75/百万输入token，$150/百万输出token；2）GPT‑4.5不支持语音模式，不能完全替代GPT‑4o；3）Sam Altman原话关于“像与体贴的人对话”“巨大而昂贵、GPU不足”；4）白皮书表述：非Frontier Model，但处于无监督学习前沿；5）Andrej Karpathy对GPT‑4.5定位为非推理模型、偏EQ任务的评价。

返回文章列表