Claude 3 横空出世：它凭什么被称为“GPT‑4 级别的杀手”？

AI PM 编辑部 · 2024年03月05日 · 5 阅读 · AI/人工智能

通用人工智能 Claude 3 Gemini GPT-4 OpenAI Anthropic

正在加载视频...

视频章节

Anthropic 刚刚发布 Claude 3，就被圈内人一句话点燃：“还没看测试数据，就知道是 GPT‑4 级别。”更耐人寻味的是，一位以爆料 OpenAI 著称的人突然把注意力转向 Anthropic，甚至放话 CEO“正在感受到 AGI”。这不是一次普通的模型更新，而是一次格局变化的信号。

Claude 3 横空出世：它凭什么被称为“GPT‑4 级别的杀手”？

Anthropic 刚刚发布 Claude 3，就被圈内人一句话点燃：“还没看测试数据，就知道是 GPT‑4 级别。”更耐人寻味的是，一位以爆料 OpenAI 著称的人突然把注意力转向 Anthropic，甚至放话 CEO“正在感受到 AGI”。这不是一次普通的模型更新，而是一次格局变化的信号。

还没跑完测试，内行人就知道它不一样了

Claude 3 发布的第一反应，并不是“参数多少”“价格几何”，而是一种罕见的行业共识：它是 GPT‑4 这个量级的模型。视频里提到，教授 Ethan Mollick 在还没来得及做完整评测前，就已经确认这一点——原因很简单，用过就知道。

在当前大模型竞争中，这是一个非常反直觉的信号。过去一年，大家已经习惯了“看榜单说话”，但 Claude 3 的出现，反而让不少一线使用者先于 benchmark 给出了判断。这意味着什么？意味着模型在推理、理解、表达这些“日常高频场景”里，已经明显越过了一条体验阈值。

一句话总结：这不是那种“分数高 2 点”的升级，而是让专业用户立刻察觉到差异的那种。

“Then there were three”：大模型战局正式三足鼎立

视频里有一句耐人寻味的话：“Then there were three.”——直到 Claude 3 出现，真正被默认放在同一桌比较的，其实只有 GPT‑4 和 Gemini。

这句话背后，是竞争格局的变化。Anthropic 长期被认为“稳健、保守、偏研究”，但 Claude 3 的发布，等于直接向市场宣告：我们不只是安全路线的代表，我们也能打正面战。

更有意思的是，这次话题的引爆点并不来自 Anthropic 自己，而是来自一位知名 OpenAI 爆料者 Jimmy Apples。他公开表示注意力已经转向 Anthropic，并声称其 CEO 正在“feeling the AGI”。这种来自“对手观察者”的转向，本身就是一个强信号：这家公司，已经无法被忽视。

真正值得警惕的，不是性能，而是节奏

如果只看性能，Claude 3 是一次成功的发布；但如果看节奏，它可能更值得 OpenAI 和 Google 警惕。

Anthropic 并没有提前大肆预热，也没有反复放风，而是选择在一个节点直接亮牌——而且一亮就是“GPT‑4 级”。这说明两件事：第一，它已经对自身模型的成熟度有足够信心；第二，它不再满足于“追赶者”的位置。

在大模型进入平台化竞争的阶段，真正危险的从来不是某一次 benchmark 被超越，而是你突然发现：对手开始和你用同样的速度、同样的标准在推进。这也是为什么视频里用词非常直接——‘move over OpenAI， move over Gemini’。

总结

Claude 3 的意义，并不只在于“它是不是比 GPT‑4 强”，而在于它让顶级大模型的竞争重新回到一个多方拉锯的状态。对从业者来说，这意味着两件事：第一，模型选择不再是单选题，实际体验会变得越来越重要；第二，Anthropic 正在从“值得尊敬的研究公司”，转变为“必须认真对待的竞争者”。接下来值得你关注的不是口号，而是：它在真实业务场景中的稳定性、成本结构，以及迭代速度。大模型的下一阶段，拼的就是这些。

关键词： Claude 3， Anthropic， GPT-4， Gemini，通用人工智能

事实核查备注：需要核查：1）Ethan Mollick 关于 Claude 3 体验的具体原话；2）Claude 3 benchmark 表现的官方数据；3）Jimmy Apples 关于 Anthropic CEO“feeling the AGI”的原始表述与时间；4）视频发布时间 2024-03-05。

返回文章列表