为什么真正做机器人公司的第一步,反而是不要做人形机器人

AI PM 编辑部 · 2026年04月14日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在押注人形机器人时,这场 South Park Commons 的对谈却反其道而行:被 Amazon 收购的机器人公司、从游戏走向现实世界的 AI Agent、以及用全自动实验室颠覆材料科学的团队,都在做同一件事——刻意避开最性感的路线。这期视频里,藏着 AI 进入物理世界最真实、也最残酷的路径。

为什么真正做机器人公司的第一步,反而是不要做人形机器人

当所有人都在押注人形机器人时,这场 South Park Commons 的对谈却反其道而行:被 Amazon 收购的机器人公司、从游戏走向现实世界的 AI Agent、以及用全自动实验室颠覆材料科学的团队,都在做同一件事——刻意避开最性感的路线。这期视频里,藏着 AI 进入物理世界最真实、也最残酷的路径。

Amazon 为什么买它?答案不是硬件,而是“和人一起生活的想象力”

对谈一开始就抛出一个信息量极高的事实:Amazon 收购了一家机器人公司。原因并不是某个参数领先,也不是成本曲线,而是 Amazon“真的喜欢他们对未来机器人如何与人类共存的愿景”。

这句话非常反直觉。在硬科技并购里,愿景通常是 PPT 上的附属品,但在这里,它成了交易本身。更重要的是,这家公司并没有直接冲向人形机器人。相反,他们明确表示:现在就做 humanoid,既不安全,也不可规模化,更不适合真实环境部署。

他们选择的是一条更慢、但更现实的路:先把机器人做得“可接近、可实验、可在现实世界中反复试错”。这也解释了为什么大厂在物理 AI 上越来越像耐心资本——真正难的不是造一个看起来像人的东西,而是让机器在复杂世界里不出事。

从游戏到现实:世界模型的第一块拼图,居然来自虚拟世界

另一位创始人的背景更让人意外:他来自视频游戏行业。转向现实世界 AI 的契机,并不是硬件突破,而是一个数据洞察——游戏里的数据,足够“通用”。

在游戏中,每一个动作、每一次状态变化,都是精确记录的。这种 action–state sequencing,恰好是训练世界模型最稀缺的东西。现实世界的数据不仅昂贵,而且充满噪声;而游戏,天然就是一个可控、可回放、可验证的世界。

因此,他们用游戏来训练面向现实世界的 AI Agent。不是为了玩游戏,而是为了让 agent 学会:在一个有物理规则、有因果关系的系统里,如何规划、模拟、再行动。这也是为什么他们强调,视频游戏是“数字信息的一个很好代表”,而不是玩具。

ChatGPT 不是终点,而是物理 AI 的加速器

当话题转到 ChatGPT,讨论并没有停留在生成文本,而是一个更深层的变化:它成为了 planning、simulation 和 verification 的基础设施。

在这些公司的系统里,Agent 不需要“什么都会”。它只需要知道:该调用什么工具。模型负责决策路径,工具负责执行,人类则留在回路中,做标注和验证。这种结构带来的不是一点点效率提升,而是数量级的速度变化。

这也是一个被低估的转折点:ChatGPT 并没有直接解决物理世界的问题,但它极大降低了构建复杂 Agent 系统的门槛。以前需要一个团队慢慢 glue 在一起的能力,现在可以由模型主动编排。

材料科学的真相:不是灵感不够,而是实验太慢

最硬的一段讨论,来自材料科学。问题被问得很直白:材料到底意味着什么?

答案同样直白:意味着吞吐量。即便你知道高熵合金可以承受极端高温、高压和腐蚀,如果实验、验证、合格流程跟不上,一切都只是论文。

他们给出的解法是“AI 科学家 + 全自动自驾驶实验室”。不是让 AI 猜材料,而是让系统 24 小时不间断地做实验、收集真实世界数据、快速失败。甚至在关键矿物上,主动去掉受限元素(比如 hafnium),从源头解决供应链约束。

这里的残酷现实是:物理世界没有清晰的 scaling law。自由度太多,数据太稀缺,唯一能做的就是把真实实验的速度拉到极限。

五年后的世界:从 bits 到 atoms,再回到 atoms

在结尾,他们用一句话概括了未来五年:bits to bits,bits to atoms,atoms to atoms。

不是所有东西都会变成人形机器人。第一批客户也并不期待 ubiquitous humanoids。真正先发生的,是接口层、Agent 栈、内部 AI 工具,以及对硬件栈关键部分的控制。

无论是 Raytheon 的投资逻辑,还是创业建议,都指向同一个现实:物理 AI 是资本密集型、里程碑驱动、退出路径高度结构化的生意。你必须非常清楚,自己要控制哪一层,又在哪一刻把公司卖给更大的系统。

总结

这场对谈最大的价值,不是预测哪家公司会赢,而是拆穿了一个行业幻觉:物理世界的 AI,不会因为模型更大而自动到来。它靠的是世界模型、数据管道、实验吞吐量,以及对“不要急着做人形机器人”的克制。

如果你是从业者,这意味着机会更多藏在接口、Agent 编排、实验自动化和物理系统的边缘层;如果你是创业者,这意味着要比软件时代更早思考资本强度和退出路径。真正值得反复问自己的问题是:在 bits 走向 atoms 的过程中,你解决的是哪一个不可替代的瓶颈?


关键词: AI Agent, 世界模型, 机器人, 材料科学, ChatGPT

事实核查备注: 需要核查:1)South Park Commons 视频具体时长;2)被 Amazon 收购公司的名称与时间;3)Eric Newcomer 的主持身份;4)视频中关于 high entropy alloy 的具体表述;5)bits to bits / bits to atoms 框架是否为原话。