推理才是真战场:Baseten CEO 亲口讲清 AI 云的下一轮洗牌

AI PM 编辑部 · 2026年05月01日 · 60 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。

推理才是真战场:Baseten CEO 亲口讲清 AI 云的下一轮洗牌

当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。

所有人都在谈模型,但钱其实烧在推理上

Tuhin Srivastava 在节目一开始就点破了一个行业错觉:训练模型当然重要,但规模一旦起来,真正吞噬成本、决定体验的,是推理(Inference)。不是一次性的训练,而是每天、每小时、每一次用户请求。

Baseten 之所以把自己定义为“Inference Cloud”,并不是市场包装,而是来自一线客户的真实压力——模型上线之后,延迟、吞吐、稳定性,任何一个环节掉链子,产品就会被用户抛弃。Tuhin 形容这种状态“已经疯了(nuts)”,因为需求增长不是线性的,而是被应用规模直接放大。

这也是为什么他反复强调:如果你只关心模型参数,而不关心模型在真实负载下怎么跑,那你还没进入真正的 AI 商业战场。

定制模型不是“高级玩法”,而是生存策略

节目里一个极具争议的判断是:未来大量成功的 AI 应用,都会运行在“非通用模型”之上。Tuhin 抛出的“存在性问题”在于——既然有人可以开发高度专业化的模型,那为什么还要为通用模型付出高昂的推理成本?

他并没有否认 OpenAI 等前沿模型的价值,恰恰相反,他承认“客户天然想用最前沿的东西”。但现实很快会给你一记重锤:成本、延迟、可控性。于是,越来越多团队开始问一个更现实的问题:我能不能在后训练(post-training)和推理层面,把模型调到“刚刚好”?

Baseten 收购研究团队的逻辑就在这里——推理和后训练不是两个问题,而是同一枚硬币的正反面。你不是在“微调模型”,你是在为具体业务定制一台机器。

算力不是买得到的资源,而是一种金融问题

当话题转向算力容量(capacity)时,讨论明显变得更现实,也更残酷。Tuhin 直接指出:供应端和运营端正在被压到极限。你不是想要多少 GPU 就能买多少,而是要提前多久锁定、需要多少融资、能不能承担预测错误的风险。

这已经不再是纯技术问题,而是典型的“金融 + 运营”混合题。你买早了,需求没到;你买晚了,客户已经流失。更糟的是,推理成本下降并不意味着需求会减少,恰恰相反——“inference going down just begets more”。

便宜的推理会催生更多应用,而不是让现有系统松一口气。这是一个自我强化的循环,也是为什么云推理公司必须具备极强的前瞻性判断。

没有人想要“素食推理”,开发者要的是现成答案

节目里最容易被忽略、但极其锋利的一句话是:“No one wants a vegan inference。”Tuhin 用这个比喻来解释开发者真实的心理状态——你可以有理念、有偏好,但最终大家要的是好吃、便宜、马上能用。

就像替代牛奶最终被整合进咖啡馆的标准菜单,AI 推理也正在走向“默认基础设施”。开发者不想自己搭一切、不想理解每个底层细节,他们只关心:性能能不能打、成本稳不稳定、出了问题有没有人负责。

这也解释了 Baseten 内部强调的“operations culture”——当系统出问题时,办公室里应该像拉响警报一样。这不是浪漫的研究文化,而是对现实世界 SLA 的妥协。

未来的 AI 云,比拼的不是模型,而是判断力

在节目结尾,话题回到一个更宏观的问题:这一切会走向哪里?Tuhin 的答案并不宏大,却异常清醒——真正拉开差距的,是你如何判断市场变化、何时下注、在哪里构建护城河。

模型会被追平,框架会被开源,硬件会被复制,但对需求拐点、成本曲线和客户真实行为的判断,很难被“抄作业”。这也是为什么他不断强调“unlock value”——技术本身不值钱,释放出来的价值才值钱。

总结

这期对话给 AI 从业者最大的提醒是:别只盯着模型排行榜。真正影响你产品生死的,是推理成本、系统稳定性,以及你是否为真实场景做了足够多的定制。如果你在创业或选型,不妨反问自己三个问题:我的推理成本结构清楚吗?我真的需要最前沿模型吗?我是否低估了运维和容量规划的难度?未来一年,AI 的竞争将越来越像一场运营与判断力的较量,而不是参数的炫技。


关键词: AI推理, Inference Cloud, 定制模型, 云AI, Baseten

事实核查备注: 需核查:Baseten CEO Tuhin Srivastava 的准确姓名与职务;视频发布时间与时长;Baseten 是否近期收购研究团队;节目中关于 OpenAI 的具体表述是否为直接引用。