GPT‑4.5 并不更聪明,却更“懂你”:OpenAI 这步棋让开发者很纠结

AI PM 编辑部 · 2025年02月28日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

OpenAI 发布 GPT‑4.5,本以为是“最强大脑”,结果却成了“高情商选手”。它更会聊天、更懂情绪,却未必更会写代码。这一次升级,不只是一款模型的变化,而是 OpenAI 对 AI 路线的一次明确表态。

GPT‑4.5 并不更聪明,却更“懂你”:OpenAI 这步棋让开发者很纠结

OpenAI 发布 GPT‑4.5,本以为是“最强大脑”,结果却成了“高情商选手”。它更会聊天、更懂情绪,却未必更会写代码。这一次升级,不只是一款模型的变化,而是 OpenAI 对 AI 路线的一次明确表态。

所有人都等更强智商,OpenAI 却交出了一颗“高情商大脑”

GPT‑4.5 发布后,最失落的一群人其实是开发者。视频作者 Ras Mic 直言,他原本期待的是“更聪明的 GPT”,结果拿到的却是一个“更有情绪感知、更懂人类语境”的模型。简单说,GPT‑4.5 不像一个冷静高效的工程师,更像一个很会共情的对话对象。

OpenAI 自己的早期测试也印证了这一点:GPT‑4.5 在“自然对话、理解用户意图、写作润色”上的表现明显提升,但在编程、解决复杂实际问题上,并没有拉开代差。这种反差,正是争议的源头——当行业都在卷推理、卷智商,OpenAI 却把筹码压在了“情绪理解”上。

一句“Yo”,暴露了 GPT‑4.5 的真实定位

Ras Mic 用了一个极具传播力的测试:对不同模型只说一句“Yo”。Claude 3.7 的回应礼貌、标准、毫无个性;而 GPT‑4.5 的回复却明显更口语、更“在状态”,甚至有点用力过猛。

这个细节很关键。它说明 GPT‑4.5 并不是为“极致理性任务”而生,而是更偏向“人类面对面的应用场景”。Ras Mic 甚至直接点名:如果你要做一个 AI 心理咨询师、陪伴型助手、或任何强人机交互的产品,GPT‑4.5 可能是目前最合适的模型之一。

换句话说,它不是最强的程序员,却可能是最像人的 AI。

从工程视角看:GPT‑4.5 选了“世界模型”,没选“推理”

视频里一个容易被忽略、但极其重要的判断是:GPT‑4.5 不是推理模型。Ras Mic 对比了 OpenAI 的技术路线——一条是“推理轴”,让模型学会链式思考(如 o1、O3 mini、DeepSeek R1);另一条是“无监督学习轴”,提升对世界的整体理解和直觉。

GPT‑4.5 明显属于后者。它更像一个“世界模型更准的助手”,而不是“一步步推导答案的解题机器”。这也解释了为什么它在规划、写作、头脑风暴上体验极佳,却在严肃编程任务中,依然打不过 Claude 3.7。

更现实的问题是价格:官方渠道要用 GPT‑4.5,几乎等同于每月 200 美元的门槛。Ras Mic 给出的“曲线救国”方案,是通过第三方 UI 接入自己的 API Key,用多少付多少,但成本依旧不低。

真正的日常选择:为什么老开发者还在用 Claude 3.7

在横向对比中,Ras Mic 的结论很明确:GPT‑4.5 很好,但不是他的 daily driver。他依然更依赖 Claude 3.7 和 3.5,原因只有一个——它们在编程时更“靠谱”。

一个形象的比喻是:Claude 3.7 像一个“过度努力的实习生”,你让它改一段代码,它会顺手帮你把边角料都收拾干净;而 GPT‑4.5 更像一个擅长聊天和理解氛围的产品经理。

当你写代码时,情商并不是刚需,确定性才是。

总结

GPT‑4.5 最大的价值,不在于“更强”,而在于“更像人”。这释放了一个清晰信号:OpenAI 正在为人类直面 AI 的应用场景下注,而不是继续单点突破推理能力。对开发者来说,真正成熟的选择是“按场景选模型”——写代码用 Claude,做陪伴和创作选 GPT‑4.5。未来的竞争,不再是谁更聪明,而是谁更适合被放进真实世界。


关键词: GPT-4.5, OpenAI, Claude 3.7, 大语言模型, AI 应用

事实核查备注: 需要核查:GPT‑4.5 的正式发布时间(2025-02-28);官方订阅价格是否为每月 200 美元;OpenAI 关于“无监督学习与推理轴”的原始表述;视频中提到的第三方工具 T3 Chat 的准确名称与功能描述。