正在加载视频...
视频章节
在这期对话中,Samsara CEO Sanjit Biswas分享了一个与主流“屏幕内AI”截然不同的判断:下一波AI革命将发生在现实世界中。从凌晨三班制到物理AI的拐点,他结合自身创业与规模化经验,解释了为什么数据、推理与真实环境的结合,正在重塑全球基础设施的运行方式。
不在屏幕上的AI革命:Samsara CEO谈“物理世界”的拐点
在这期对话中,Samsara CEO Sanjit Biswas分享了一个与主流“屏幕内AI”截然不同的判断:下一波AI革命将发生在现实世界中。从凌晨三班制到物理AI的拐点,他结合自身创业与规模化经验,解释了为什么数据、推理与真实环境的结合,正在重塑全球基础设施的运行方式。
为什么下一次AI革命不会发生在屏幕里
很多人谈论AI时,脑海里首先浮现的是聊天机器人、代码助手或内容生成工具。但Sanjit Biswas一开场就把视角拉向了“屏幕之外”。他提出一个极具画面感的判断:如果你认真想一想,世界其实早就存在“第三个班次”——从午夜到早上8点。过去,这段时间里大量基础设施和实体运营是低效甚至停滞的,而AI的引入,正在改变这一点。
在他看来,AI真正的颠覆不只是提高单个白领的效率,而是“提升整个世界运转的速度”。当算法开始理解车辆、工厂、摄像头和传感器所处的真实环境,AI不再只是工具,而是成为基础设施的一部分。这也是他反复强调的观点:那些“支撑地球运转的行业”,长期被技术浪潮忽视,却可能是AI释放最大价值的地方。
这种判断并非理论推演,而是来自一个“真正把公司规模化做起来的人”的经验总结。与很多停留在实验室或Demo阶段的AI叙事不同,他关注的是:AI是否真的能在凌晨三点的真实世界里,稳定、持续地创造价值。
物理AI的拐点:从数据到现实语境的理解
Sanjit明确指出,“物理AI”正在经历一个关键拐点。所谓物理AI,指的是能够理解和作用于现实世界的AI系统,而不仅是处理文本或代码。过去的瓶颈在于,模型很难把海量数据与具体的现实语境结合起来,但这一点正在发生变化。
他提到一个重要差异:在物理世界中,你面对的不是少量高质量样本,而是“数以百万计”的设备、传感器和终端。这让很多事情变得更难,同时也带来独特优势。难,是因为现实环境充满噪声、不确定性和边缘情况;优势在于,一旦系统跑通,规模化数据会反过来持续强化模型能力。
在谈到模型进展时,他并没有给出夸张承诺,而是一个相对克制但乐观的判断:相关能力在未来两到三年内还会“变得更好”。尤其是在视频理解和推理方面,模型正在逐步具备把视觉信息转化为可行动洞察的能力。这并不是单点突破,而是数据、计算和工程能力共同积累的结果。
在真实世界训练AI:相关数据比“更大的模型”更重要
当话题转向大语言模型和训练方法时,Sanjit给出了一个非常务实的原则:并不是把最大、最通用的模型直接搬到物理世界,而是“用与任务真正相关的数据来训练它”。这句话看似简单,却点出了物理AI与通用AI最大的不同。
在现实场景中,错误的代价往往更高。一次判断失误,可能意味着运营中断,甚至影响人的安全。因此,他强调训练和推理必须深度嵌入具体场景。你需要理解环境、约束和操作流程,而不仅是语言本身。这也是为什么他认为,数据和AI这两件事“彼此强化,站在了我们这一边”。
这种思路背后,是多年工程和运营经验的沉淀。他坦言,这并不是一蹴而就的过程,“需要一个村庄的力量”——从数据采集、标注,到模型迭代和系统部署,每一步都要为现实负责。正是这些看似笨重的工作,构成了物理AI难以被快速复制的护城河。
从创业选择到2030年的想象:被忽视的世界正在苏醒
回顾个人经历时,Sanjit提到自己为什么会选择这个看似不性感的领域:源自一种对“被忽视世界”的好奇。很多基础设施行业长期不在聚光灯下,却真实地承载着社会运行。他形容自己在回放过去二十年的经历时,能清楚地看到一件事——自己和团队“每一年都在变得更擅长”。
当被问到自动化和自主系统的未来,他刻意把视角拉到“大图景”层面,而不是某一个具体产品。他认为,人与AI的关系不会是简单的替代,而是一种协作,尤其是在复杂、动态的物理环境中。这种协作本身,也会催生出很多“意想不到的上行空间”。
展望2030年,他用了一种克制的乐观来形容当下的时点:我们正站在门槛上。一些关键能力已经具备,另一些还在快速逼近。一旦跨过去,AI对现实世界的影响,可能会像当年互联网一样,被事后证明“比我们想象的还要大”。
总结
这场对话最大的价值,不在于某个具体技术名词,而在于视角的转移:从屏幕里的AI,走向现实中的AI。Sanjit Biswas用自身经验提醒我们,真正艰难、也最有长期价值的创新,往往发生在嘈杂、不完美的物理世界。对于读者而言,这不仅是一次行业判断,更是一种思考方式:下一次真正改变世界的技术,可能正在我们很少关注的地方悄然成形。
关键词: 物理AI, AI推理, 计算机视觉, 大语言模型, 模型训练
事实核查备注: Sanjit Biswas 为 Samsara CEO;观点来自 Sequoia AI Ascent 于 2025-12-16 发布的视频《Why the Next AI Revolution Will Happen Off-Screen》;原话包括“there's like a third shift between midnight and 8 a.m.”、“Physical AI feels like it's finally going through an inflection moment”、“we train it with the data that's relevant for the task”;涉及技术概念:大语言模型、模型训练、视频推理、计算机视觉。