把前沿大模型搬回家:一位工程师对云AI的“反叛”
当所有人都在把最强的大模型推向云端,Alex Cheema 却在做一件反方向的事:让 Frontier AI 跑在你自己的硬件上。这场看似“逆潮流”的尝试,背后藏着对成本、控制权和 AI 未来形态的深刻判断。
当所有人都在把最强的大模型推向云端,Alex Cheema 却在做一件反方向的事:让 Frontier AI 跑在你自己的硬件上。这场看似“逆潮流”的尝试,背后藏着对成本、控制权和 AI 未来形态的深刻判断。
很多人以为“真·AI 应用”只能在云端完成,但 Google DeepMind 在这场 AMA 里给了一个完全相反的答案:Android 正在把生成式 AI 直接塞进手机里,而且已经能用。这场对话不讲概念,直面限制、取舍和真正可落地的路径。
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。
如果你只把这期节目当作“新闻拼盘”,你就错过了真正的主线:全球AI产业的权力、算力与话语权,正在同时在北京、太空和数据中心里重组。从特朗普与习近平的会面,到黄仁勋的皮衣,再到SpaceX和Google把服务器送上轨道,这不是巧合,而是一张正在收紧的网。
Manus为什么能在发布后迅速引爆市场、候补名单破百万、邀请码被炒到高价?答案不在模型参数,而在一次临时决定的产品视频、一个“让AI自己动手”的设计理念,以及一套完全不同于传统软件的产品方法论。
在Claude开发者大会上,Anthropic抛出两颗“看起来不炸、但后劲极大”的炸弹:一是几乎拿下SpaceX Colossus集群的全部算力,二是悄然上线Cloud Managed Agents。这不是发布会失误,而是AI工作方式正在分叉的信号。
当所有人都在讨论更大的模型、更贵的Token时,Google DeepMind在这场分享里反复强调了一件“反直觉”的事:真正能跑起来的AI,必须回到设备本身。从Gemma 4到端侧Agent,这不是性能妥协,而是一场架构转向。
这一季财报最反直觉的不是“AI赚了多少钱”,而是:赚得越多,投资人越焦虑。Google暴涨、Meta暴跌、Amazon继续疯狂砸钱,Microsoft稳得像老干部——AI叙事第一次出现明显分叉。这不是一轮简单的科技股行情,而是一场关于“谁能把AI变成真钱”的公开对赌。
当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。
当 ChatGPT 插件刚出现时,他给妻子打电话说:一切都完了,所有 App 都会被吃掉。这不是空谈,而是一个从10岁开始写待办清单、连续失败十几年的产品人,对“生产力工具”和 AI Agent 未来的真实反思。