3B参数塞进手机：边缘AI正在逼苹果和OpenAI改路线

AI PM 编辑部 · 2023年10月02日 · 3 阅读 · AI/人工智能

Sam Altman Token 边缘AI AI应用多模态大语言模型生成式AI 模型部署模型训练 ChatGPT

正在加载视频...

视频章节

大模型一定要跑在云端？Stability AI用一个“能在普通手机上跑”的3B参数模型，直接把这个共识掀翻。更刺激的是，这正在迫使苹果、OpenAI，甚至整个AI硬件形态重新思考自己的下一步。

3B参数塞进手机：边缘AI正在逼苹果和OpenAI改路线

大模型一定要跑在云端？Stability AI用一个“能在普通手机上跑”的3B参数模型，直接把这个共识掀翻。更刺激的是，这正在迫使苹果、OpenAI，甚至整个AI硬件形态重新思考自己的下一步。

真正反直觉的突破：不是更大，而是刚刚好

过去一年，关于大语言模型的主旋律只有一个字：大。参数更大、算力更猛、集群更豪华。但Stability AI最近的动作，明显在“逆Scaling Laws而行”。他们发布了一个只有30亿参数的Stable LM Alpha，却强调了一个关键信息——它“可以运行在普通智能手机上”。更夸张的是，这个模型训练时用了4万亿tokens。这里的反差感非常强：参数规模被压缩到极限，但训练强度并没有妥协。这背后传递的信号很明确：行业开始认真对待一个问题——如果模型不出设备，用户的数据就不出设备。对隐私、延迟、成本都敏感的场景，这不是锦上添花，而是决定生死的差异。

为什么苹果迟迟没下场？13GB这道墙还没倒

这也解释了另一个现象：为什么苹果在生成式AI和LLM上显得异常克制。视频里点破了一个现实细节——即便是Llama 2最小的7B模型，体量也在13GB左右，这在今天的智能手机上依然“不具备实用性”。这不是算法理想的问题，而是内存、功耗、散热的物理约束。即便芯片厂商（比如MediaTek）已经开始喊话“可以在手机上跑AI任务”，但现实是：要跑得久、跑得稳、还能让普通用户感觉‘有用’，门槛极高。这也是为什么Stability选择‘缩模型’这条路，而不是等下一代手机硬件。谁能先跨过这道13GB的墙，谁就有机会定义下一代AI体验。

另一条路线：不是把AI塞进手机，而是重做手机

当然，行业并不是只有一种解法。视频里提到一个更激进的方向：干脆为LLM重做硬件。Dave Lee半开玩笑地“说服”ChatGPT，让它同意OpenAI应该做自己的LLM手机和操作系统。这听起来像玩笑，但背景很真实——Sam Altman确实在和前苹果传奇设计师Jony Ive接触；Meta已经把AI直接塞进Ray-Ban眼镜；Humane的无屏AI设备即将公布更多细节。从这个角度看，ChatGPT with Vision更像一个预告片：当AI能‘看见’你所处的世界，手机可能不再是唯一入口，甚至不是最佳入口。

总结

把大模型搬到手机上，并不只是一次工程优化，而是一场路线分叉：一条路是把模型缩到足够小，真正落地在边缘设备；另一条路是围绕AI重做硬件形态。对AI从业者来说，这意味着两个机会窗口：要么研究如何在小模型上榨出更高质量，要么思考哪些真实场景值得为AI单独设计硬件。接下来一年，谁能在‘能跑’和‘有用’之间找到平衡，谁就可能成为下一个平台级赢家。你现在下注的是哪一边？

关键词：边缘AI，大语言模型， Stable LM， AI硬件，多模态

事实核查备注：需要核查：Stability AI Stable LM Alpha参数规模（3B）、训练token数量（4万亿）、是否明确支持普通智能手机；Llama 2 7B模型体量约13GB的说法；MediaTek关于手机端AI能力的公开表态；Sam Altman与Jony Ive的接触是否为公开报道；Meta Ray-Ban AI眼镜与Humane发布时间节点。

返回文章列表