只用GPT-4四成功力，Inflection 2.5想把AI变成你的“情绪基础设施”

AI PM 编辑部 · 2024年03月09日 · 4 阅读 · AI/人工智能

Elon Musk Mark Zuckerberg Mustafa Suleyman Sam Altman AI应用 AI搜索大语言模型生成式AI 代码生成对话AI

正在加载视频...

视频章节

当所有人盯着GPT-4、Claude 3谁更强时，Inflection 2.5悄悄走了一条更危险、也更野的路：不做最强助手，而是做“最懂你的AI”。更反直觉的是，它用远少于GPT-4的算力，逼近同一性能区间。

只用GPT-4四成功力，Inflection 2.5想把AI变成你的“情绪基础设施”

当所有人盯着GPT-4、Claude 3谁更强时，Inflection 2.5悄悄走了一条更危险、也更野的路：不做最强助手，而是做“最懂你的AI”。更反直觉的是，它用远少于GPT-4的算力，逼近同一性能区间。

在OpenAI沉默的窗口期，真正的变量出现了

Elon Musk 起诉 OpenAI 的余波还没散去，一个耐人寻味的现象已经发生：当 OpenAI 暂时没有“新炸弹”，其他基础模型公司几乎同时冲了出来。Claude 3、Gemini Advanced，被大量一线用户评价为“真的比 GPT-4 好用”。这件事本身已经足够反直觉——因为 GPT-4 在 AI 时间尺度里，才刚刚‘过了一年’。

但更重要的不是谁赢了 benchmark，而是一个信号：GPT-4 这个曾经独一档的高度，正在被快速商品化。就在这个背景下，Inflection 2.5 的出现显得格外刺眼——它不是来正面拼助手效率的，而是试图重新定义“你为什么需要一个AI”。

Inflection 2.5：算力少四成，却摸到了GPT-4的天花板

从硬指标看，Inflection 2.5 在 MMLU、数学、代码、常识推理等测试上，相比 1.0 有明显跃迁，并且“正在逼近 GPT-4 水平”。真正让从业者坐直身子的，是那句轻描淡写的补充：训练它用的计算资源，大约只有 GPT-4 的 40%。

这意味着两件事。第一，效率红利真的存在，而且不只在 OpenAI 和 Anthropic 手里。第二，大模型竞争的下半场，可能不是‘谁堆更多卡’，而是‘谁更懂得把能力用在对的地方’。

更有意思的是，Inflection 这次高调强调了编码和数学能力——而这在过去是他们刻意淡化的方向。Mark Zuckerberg 之前谈 Llama 3 时提过一个关键洞察：编码能力提升，会外溢式地改善模型在非编程问题上的整体推理能力。Inflection 很可能也撞上了同一条规律。

他们不想做助手，而是想承包你的孤独

Pi 从一开始就不是“帮你写代码、做PPT”的那类 AI。Inflection CEO Mustafa Suleyman 给它的定义非常直白：融合 IQ 与 EQ 的个人 AI。用更不官方的话说，它瞄准的是“反孤独”场景——一个你可以聊任何事、而不是只聊任务的对象。

这也解释了为什么 Pi 的用户数据看起来和 ChatGPT 完全不同：平均单次对话 33 分钟，10% 的对话超过 1 小时；每周使用过的人里，60% 下周还会回来；累计 40 亿条消息。这不是工具的使用曲线，而是陪伴型产品的曲线。

甚至连商业模式，他们一开始都没想清楚。没有明确订阅墙，先把关系建立起来。也正因此，Pi 极度分裂：有人完全不理解需求在哪里，也有人认为这是“第一次真正尝试把 AI 变成朋友”。

个人AI这条路，要么巨大，要么危险

Inflection 目前的数据并不小：100 万 DAU、600 万 MAU，最近两个月周增长约 10%。和 OpenAI 动辄上亿的用户规模比，它还很早期；但在“深度参与感”这个维度，它可能走得更前。

风险也同样清晰。越是情感绑定的 AI，越会被放大伦理、依赖性和社会影响的问题。《Her》不是一个褒义隐喻。但正如 Ethan Mollick 说的那样：正因为它足够不同，理解 Pi，可能会帮助你理解整个 AI 演化的下一阶段。

总结

如果你是 AI 从业者，Inflection 2.5 值得关注的从来不只是“接近 GPT-4”。真正重要的是三个信号：模型性能正在被快速拉平；效率和能力外溢开始取代单纯 scaling；以及，一个全新的主战场正在形成——不是生产力，而是情感与长期关系。

你不一定看好“AI 朋友”，但你最好理解它。因为下一波真正的用户黏性，可能不来自更强的工具，而来自更难替代的陪伴。

关键词： Inflection 2.5， Pi， GPT-4，个人AI，大语言模型

事实核查备注：需要核查：Inflection 2.5 使用约 GPT-4 40% 训练算力的说法；1M DAU、6M MAU、40 亿消息、33 分钟平均对话时长；用户周留存约 60%；Mustafa Suleyman 关于个人AI与增长率的表述；Claude 3、Gemini Advanced 被广泛认为优于 GPT-4 的用户评价背景。

返回文章列表