GPT‑4.5不是最强模型,却可能最像“一个人”
正在加载视频...
视频章节
GPT‑4.5的发布没有刷新推理榜单,却引发了强烈的情绪化讨论。本篇文章还原The AI Daily Brief的核心判断:这是一款以“感觉”和创造力取胜的模型,代表了OpenAI在无监督预训练上的一次极限尝试,也揭示了未来模型分工的新方向。
GPT‑4.5不是最强模型,却可能最像“一个人”
GPT‑4.5的发布没有刷新推理榜单,却引发了强烈的情绪化讨论。本篇文章还原The AI Daily Brief的核心判断:这是一款以“感觉”和创造力取胜的模型,代表了OpenAI在无监督预训练上的一次极限尝试,也揭示了未来模型分工的新方向。
一场并不追求赢榜单的发布,反而更耐人寻味
为什么GPT‑4.5明明被高调发布,却又被OpenAI反复强调“不是Frontier Model”?这正是这次发布最反常、也最值得关注的地方。The AI Daily Brief指出,OpenAI已经明确:在GPT‑4.5之后,将迎来GPT‑5或其等价物,一个“推理模型(O系列)与GPT系列完全混合”的时代。换句话说,4.5并不是冲着终局去的。
更反常的是定位。GPT‑4.5在多项准备度评估中,明确落后于o1、o1‑mini以及Deep Research,甚至无法完全替代GPT‑4o——比如它没有语音模式。这在以往OpenAI的版本演进中几乎没有先例。主持人直言:这不是一次性能升级,而是一种“方向展示”。
OpenAI在白皮书中写得很清楚:GPT‑4.5“没有引入全新的前沿能力”,但却站在“超大规模无监督学习”的最前沿。这意味着,它的价值并不在推理能力,而在预训练所能带来的另一种智能形态。
“Vibes”成为关键词:OpenAI在押注什么?
在官方公告中,OpenAI几乎没有强调参数、准确率或推理链,而是反复提到一个模糊却真实的词:感觉。公告写道,早期测试显示,与GPT‑4.5的互动“更自然”,拥有更强的用户意图理解能力和更高的EQ,适合写作、编程和实际问题解决。
The AI Daily Brief将这种变化总结为:我们已经进入“Vibes”的时代。GPT‑4.5在人类评测中,被普遍认为比GPT‑4o更适合“日常专业和创意查询”,同时还表现出更低的幻觉率(hallucination)。在一个示例中,面对情绪低谷的用户,GPT‑4.5给出了明显更具同理心的回应,这种差异无法用传统benchmark衡量,却极易被人感知。
Sam Altman在个人帖子中写道:“这是第一个让我感觉像是在和一个体贴的人对话的模型。”他坦言,自己曾多次因为AI给出的建议而“坐在椅子上感到震惊”。这句话几乎定义了GPT‑4.5存在的理由。
写作能力的断层式提升:一个恐怖故事的对比
如果说GPT‑4.5有什么几乎一致被认可的优势,那就是写作。多位教授和开发者的反馈非常相似:它“写得漂亮、极有创造力”,但在复杂工程任务上反而显得有些“懒”。有人形容,这就像一个“更成熟的大脑”,单位字数里信息密度更高。
一个被反复引用的例子来自Ben Hilac。他用同一个“恐怖短篇故事”的提示词,分别测试GPT‑4o和GPT‑4.5。结果是,4.5生成的故事明显更原创、更生动、也更令人不安。他的结论非常直接:“这甚至不是一个接近的比较,这是第一次让我觉得用AI写作真的感觉很好。”
前OpenAI联合创始人Andrej Karpathy从更宏观的角度解释了这种差异。他认为GPT‑4.5不是推理模型,而是在EQ而非IQ任务上全面进化——包括世界知识、幽默感、类比能力和创意表达。在他展示的五组写作对比(讽刺、诗歌、想象任务)中,GPT‑4.5在投票中大多胜出。
昂贵、稀缺、也可能是一次“过渡性实验”
负面声音几乎全部集中在一个问题上:成本。GPT‑4.5的API定价高达每百万输入token 75美元、输出token 150美元,显著高于o1‑mini或Google Gemini。这让不少开发者怀疑,它是否在刻意抑制规模化使用,甚至不鼓励蒸馏。
更微妙的是OpenAI自己的态度。在一份官方说明中,公司表示GPT‑4.5“计算密集、成本高昂,并非GPT‑4o的替代品”,同时仍在评估是否长期提供API支持。这被Andrew Curran解读为:GPT‑4.5可能主要是为ChatGPT直面消费者而存在,而非一个稳定的开发者基座。
Sam Altman也承认了现实限制:“这是一个巨大而昂贵的模型……我们现在GPU不够。”他强调,4.5不会“碾压benchmark”,但代表了一种“不同类型的智能,一种新的魔法”。从这个角度看,它更像一次为GPT‑5探路的实验。
总结
The AI Daily Brief给出的最终判断非常清醒:不同模型将各司其职,就像“街头智慧”和“书本智慧”并存。GPT‑4.5也许不会成为最强推理引擎,却可能重新定义高质量写作和创意表达的标准。对普通用户和内容创作者而言,减少“AI味道”本身就是巨大的生产力提升。而对行业来说,这次发布透露的信号是:在通往GPT‑5之前,OpenAI正在认真探索,什么才是真正“像人”的智能。
关键词: GPT-4.5, OpenAI, 无监督学习, 生成式AI写作, 模型定位
事实核查备注: 关键事实核查点:1)GPT‑4.5定价:$75/百万输入token,$150/百万输出token;2)GPT‑4.5不支持语音模式,不能完全替代GPT‑4o;3)Sam Altman原话关于“像与体贴的人对话”“巨大而昂贵、GPU不足”;4)白皮书表述:非Frontier Model,但处于无监督学习前沿;5)Andrej Karpathy对GPT‑4.5定位为非推理模型、偏EQ任务的评价。