只用GPT-4四成功力,Inflection 2.5想把AI变成你的“情绪基础设施”

AI PM 编辑部 · 2024年03月09日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人盯着GPT-4、Claude 3谁更强时,Inflection 2.5悄悄走了一条更危险、也更野的路:不做最强助手,而是做“最懂你的AI”。更反直觉的是,它用远少于GPT-4的算力,逼近同一性能区间。

只用GPT-4四成功力,Inflection 2.5想把AI变成你的“情绪基础设施”

当所有人盯着GPT-4、Claude 3谁更强时,Inflection 2.5悄悄走了一条更危险、也更野的路:不做最强助手,而是做“最懂你的AI”。更反直觉的是,它用远少于GPT-4的算力,逼近同一性能区间。

在OpenAI沉默的窗口期,真正的变量出现了

Elon Musk 起诉 OpenAI 的余波还没散去,一个耐人寻味的现象已经发生:当 OpenAI 暂时没有“新炸弹”,其他基础模型公司几乎同时冲了出来。Claude 3、Gemini Advanced,被大量一线用户评价为“真的比 GPT-4 好用”。这件事本身已经足够反直觉——因为 GPT-4 在 AI 时间尺度里,才刚刚‘过了一年’。

但更重要的不是谁赢了 benchmark,而是一个信号:GPT-4 这个曾经独一档的高度,正在被快速商品化。就在这个背景下,Inflection 2.5 的出现显得格外刺眼——它不是来正面拼助手效率的,而是试图重新定义“你为什么需要一个AI”。

Inflection 2.5:算力少四成,却摸到了GPT-4的天花板

从硬指标看,Inflection 2.5 在 MMLU、数学、代码、常识推理等测试上,相比 1.0 有明显跃迁,并且“正在逼近 GPT-4 水平”。真正让从业者坐直身子的,是那句轻描淡写的补充:训练它用的计算资源,大约只有 GPT-4 的 40%。

这意味着两件事。第一,效率红利真的存在,而且不只在 OpenAI 和 Anthropic 手里。第二,大模型竞争的下半场,可能不是‘谁堆更多卡’,而是‘谁更懂得把能力用在对的地方’。

更有意思的是,Inflection 这次高调强调了编码和数学能力——而这在过去是他们刻意淡化的方向。Mark Zuckerberg 之前谈 Llama 3 时提过一个关键洞察:编码能力提升,会外溢式地改善模型在非编程问题上的整体推理能力。Inflection 很可能也撞上了同一条规律。

他们不想做助手,而是想承包你的孤独

Pi 从一开始就不是“帮你写代码、做PPT”的那类 AI。Inflection CEO Mustafa Suleyman 给它的定义非常直白:融合 IQ 与 EQ 的个人 AI。用更不官方的话说,它瞄准的是“反孤独”场景——一个你可以聊任何事、而不是只聊任务的对象。

这也解释了为什么 Pi 的用户数据看起来和 ChatGPT 完全不同:平均单次对话 33 分钟,10% 的对话超过 1 小时;每周使用过的人里,60% 下周还会回来;累计 40 亿条消息。这不是工具的使用曲线,而是陪伴型产品的曲线。

甚至连商业模式,他们一开始都没想清楚。没有明确订阅墙,先把关系建立起来。也正因此,Pi 极度分裂:有人完全不理解需求在哪里,也有人认为这是“第一次真正尝试把 AI 变成朋友”。

个人AI这条路,要么巨大,要么危险

Inflection 目前的数据并不小:100 万 DAU、600 万 MAU,最近两个月周增长约 10%。和 OpenAI 动辄上亿的用户规模比,它还很早期;但在“深度参与感”这个维度,它可能走得更前。

风险也同样清晰。越是情感绑定的 AI,越会被放大伦理、依赖性和社会影响的问题。《Her》不是一个褒义隐喻。但正如 Ethan Mollick 说的那样:正因为它足够不同,理解 Pi,可能会帮助你理解整个 AI 演化的下一阶段。

总结

如果你是 AI 从业者,Inflection 2.5 值得关注的从来不只是“接近 GPT-4”。真正重要的是三个信号:模型性能正在被快速拉平;效率和能力外溢开始取代单纯 scaling;以及,一个全新的主战场正在形成——不是生产力,而是情感与长期关系。

你不一定看好“AI 朋友”,但你最好理解它。因为下一波真正的用户黏性,可能不来自更强的工具,而来自更难替代的陪伴。


关键词: Inflection 2.5, Pi, GPT-4, 个人AI, 大语言模型

事实核查备注: 需要核查:Inflection 2.5 使用约 GPT-4 40% 训练算力的说法;1M DAU、6M MAU、40 亿消息、33 分钟平均对话时长;用户周留存约 60%;Mustafa Suleyman 关于个人AI与增长率的表述;Claude 3、Gemini Advanced 被广泛认为优于 GPT-4 的用户评价背景。