被吐槽也被追捧：GPT‑5发布后真实的爱与恨

AI PM 编辑部 · 2025年08月09日 · 12 阅读 · AI/人工智能

AI推理 AI Agent 幻觉上下文窗口 GPT-4 ChatGPT OpenAI NVIDIA

正在加载视频...

视频章节

GPT‑5的发布并没有带来一边倒的赞美，反而迅速引爆了失望、困惑与惊喜并存的讨论。这篇文章还原了首批用户的真实反应，解释争议背后的技术机制，并通过具体案例说明GPT‑5真正的价值可能藏在哪里。

被吐槽也被追捧：GPT‑5发布后真实的爱与恨

GPT‑5的发布并没有带来一边倒的赞美，反而迅速引爆了失望、困惑与惊喜并存的讨论。这篇文章还原了首批用户的真实反应，解释争议背后的技术机制，并通过具体案例说明GPT‑5真正的价值可能藏在哪里。

为什么“失望”几乎是注定的：期待管理的残酷现实

要理解GPT‑5发布后的舆论分裂，首先要意识到一个反复出现的规律：越是被长期期待的模型，越容易在发布初期招致失望。视频一开始就点破了这一点——“除非它在每一个维度上都瞬间碾压一切，否则第一波声音一定来自失望的人”。这是自GPT‑4以来，OpenAI最受关注的一次更新，甚至在“心理预期”层面超过了许多实质性进步更大的模型。

因此，我们看到的并不是单纯的模型好坏之争，而是一种情绪释放。社交平台X上大量用户抱怨“想回到旧模型”，但这些情绪往往并没有清晰指向具体技术问题。演讲者的关键判断在于：与其被情绪淹没，不如拆解这些不满到底来自哪里。换句话说，GPT‑5真正的考验，并不是能力是否提升，而是它是否符合人们心中那个被放大了无数倍的想象。

一个名字，多种大脑：被隐藏的模型路由机制

最集中的技术争议，来自GPT‑5“只有一个名字，但不止一个模型”的设计。为了简化体验，OpenAI取消了显式的模型选择器，但在后台，GPT‑5会根据问题类型自动路由到不同规模的模型，包括GPT‑5 Thinking、Mini和Nano。这本意是追求“更清晰的产品体验”，却在现实中制造了新的困惑。

正如教授Ethan Malik所说：“你会在网上看到非常割裂的结果，因为GPT‑5其实是多个模型，有的很好，有的只是‘还行’。”问题在于，用户并不知道自己正在用哪一个。当一些明显质量不高的回答被截图传播时，伤害的却是“GPT‑5”这个整体品牌。更微妙的是，部分官方宣传的写作能力提升，只在GPT‑5 Thinking上明显，而它并不会始终自动切换。连OpenAI内部成员Rune都不得不提醒：“只有GPT‑5 Thinking才有真正的写作改进，记得手动切。”

这揭示了一个深层权衡：透明的模型选择 vs. 被隐藏的智能路由。演讲者并未简单站队，而是指出，这不是“更好或更差”，而是“另一组代价”，而眼下，代价正在以用户困惑的形式显现。

模型没问题，体验出问题：Plus用户的失落感

另一类批评并不指向模型本身，而是产品分层和定价策略。用户Lan Algy的愤怒极具代表性：“GPT‑5是好模型，价格也合理，但Plus用户被彻底牺牲了。”在他看来，曾经作为“高阶用户”的Plus订阅者，反而在新体系中失去了对“思考型模型”的稳定访问。

这种情绪的本质，是“权力感”的丧失。过去，用户可以明确选择自己想要的模型；现在，这种选择被算法接管，而最强能力则被锁在每月200美元的Pro账户中。演讲者指出，这会让一部分原本自认为是“重度用户”的人产生强烈反弹——不是因为模型变差，而是因为他们在新范式中失去了主导权。这一判断并不夸张，因为AI工具的价值，很大一部分来自“我知道自己在用什么”。

被忽视的亮点：普通用户与企业案例的真实收获

与社交平台上的争吵形成鲜明对比的是，真正深入使用的人，往往给出了高度正面的评价。Dan Shipper分享了一个生动的故事：他让自己的母亲——一位“重度ChatGPT用户”体验GPT‑5，结果她直接评价这是一次“范式转变”，“这个模型真的很惊人”。

在企业场景中，价值体现得更为具体。Box CEO Aaron Levy测试了GPT‑5在一份经过修改的NVIDIA财报电话会议记录上的表现，结果显示，GPT‑5捕捉到了一个此前所有顶级模型都遗漏的细微逻辑不一致。更令人意外的是，这一结果甚至出现在GPT‑5 Mini和Nano上。他的结论是：当AI Agent需要在企业内部数据上做决策时，更强的逻辑推理能力会解锁大量新的业务用例。这类收益不会在“第一天玩一玩”中显现，却可能决定长期价值。

不再过度犹豫：GPT‑5气质上的微妙转变

演讲者个人最强烈的正面感受，并非某个单点能力，而是一种“性格变化”。他直言，旧模型最糟糕的特征之一，是过度对冲和犹豫，而GPT‑5“明显更愿意给出决策，并且提供支撑逻辑”。这听起来细微，却极其重要。

Tyler Cowen也给出了相似评价，认为GPT‑5“反应极快，而且会主动预判下一个问题”。在实际使用中，这意味着模型不再只是一个被动回答器，而更像一个能参与思考过程的合作者。Flower Slop提醒大家，这只是第一个版本，但即便如此，“把GPT‑5免费开放，本身就是对人类的巨大净收益”。演讲者的态度很克制：初期负面反馈不等于失败，真正的判断，需要时间。

总结

GPT‑5的争议，并不是一次简单的“好或坏”评判，而是一次关于产品设计、用户心理与真实能力错位的集中爆发。它在推理、决策意愿和企业逻辑分析上展现了实质进步，但在模型透明度和用户控制感上付出了代价。对读者而言，最重要的启发是：不要用第一天的情绪判断一个基础模型的长期价值，真正的能力，往往藏在你还没用到的地方。

关键词： GPT‑5， OpenAI，模型路由， AI推理， AI Agent

事实核查备注：视频来源：The AI Daily Brief；提及人物：Ethan Malik、Rune（OpenAI）、Dan Shipper、Aaron Levy（Box）、Tyler Cowen；涉及模型：GPT‑5、GPT‑5 Thinking、GPT‑5 Mini、GPT‑5 Nano；公司：OpenAI、Box、NVIDIA；关键观点均来自视频原话或明确转述。

返回文章列表