算力越堆越接近AGI?a16z这期节目给了一个相反、却更残酷的答案

AI PM 编辑部 · 2026年03月17日 · 26 阅读 · AI/人工智能

正在加载视频...

视频章节

当整个行业还在相信“再多一点算力、再大一点模型就能通向AGI”时,a16z的一期对谈却直接泼了冷水:Scale 不是解药,甚至可能是陷阱。这期节目讨论的不是工程瓶颈,而是一个更致命的问题——大模型到底懂不懂世界。

算力越堆越接近AGI?a16z这期节目给了一个相反、却更残酷的答案

当整个行业还在相信“再多一点算力、再大一点模型就能通向AGI”时,a16z的一期对谈却直接泼了冷水:Scale 不是解药,甚至可能是陷阱。这期节目讨论的不是工程瓶颈,而是一个更致命的问题——大模型到底懂不懂世界。

最反直觉的结论:Scale 并不会把你带到 AGI

这期 a16z Show 最炸裂的一点,是它几乎正面否定了当前最主流的信念:Scaling Laws 能无限延伸到 AGI。

在过去几年里,行业形成了一种近乎共识的路径依赖——参数更大、数据更多、算力更强,模型就会“自然涌现”出更高层次的智能。但在这次对谈中,嘉宾明确指出:即便数学上、实验上都能证明某些能力随着规模提升而出现,这也不等于你走在通往 AGI 的路上。

原因很简单,却常被忽略:我们验证的,大多还是在同一个问题分布、同一种表示空间里的改进。换句话说,Scale 解决的是“在已知世界里做得更好”,而不是“理解世界本身”。

这也是为什么节目里会反复强调“看起来很 conclusive 的结果”,在更换视角后,其实并不那么稳固——它们证明的是优化能力,而不是认知跃迁。

In-Context Learning 很神奇,但它暴露了更深的天花板

对话中一个有意思的切口,是对 In-Context Learning 的讨论。

我们已经习惯把它当作大模型的“魔法时刻”:不给梯度更新,只靠 prompt,就能学会新任务。节目里承认——这件事本身确实有效,甚至在某些设定下效果出人意料地好。

但问题也恰恰在这里。

当研究者深入拆解后发现,你可以把 In-Context Learning 理解为某种高度结构化的相关性匹配。它并不是在形成新的因果模型,而是在已有表示空间中,快速找到一个“看起来最像”的解法子空间。

这也解释了一个现实悖论:为什么 LLM 在考试、竞赛、代码生成上表现惊艳,却在稍微改变问题表述、引入新概念时,立刻露出不稳定的一面。

节目中的一句话点得很狠:“它 worked,并不意味着它 understood。”

深度学习的“相关性世界”,走不到因果那一步

讨论最锋利的部分,发生在话题从模型机制,转向认知层面。

嘉宾直接点出一个行业心结:几乎所有深度学习,本质上都在做相关性建模。哪怕你把网络堆得再深、参数堆得再多,它仍然是在一个固定的表示假设下,对输入输出分布进行拟合。

而真正的人类智能,恰恰发生在跨越相关性之后——进入因果、组合复杂性和抽象结构的世界。

这也是为什么节目中会提到“Einstein test”。不是因为物理本身,而是因为爱因斯坦做的那件事:他不是在旧坐标系里找到更优解,而是创建了一个全新的流形(manifold)。

如果你只允许模型在“旧的 manifold”里搜索,再多的 scale,也只能得到更极致的插值,而不是范式突破。

Anthropic 做得对,但行业可能集体走偏了方向

节目里对 Anthropic 的评价,其实相当克制但正面:产品做得很好,研究也严肃。

但这并不妨碍一个更大的判断浮出水面——即便是当前最谨慎、最重视对齐的公司,也依然受限于同一套技术范式。

如果未来 AGI 真的需要的是新的表示、新的学习机制、甚至新的数学工具,那么继续把绝大多数资源押注在 scale 上,很可能是一种“看起来最安全、实际上最保守”的选择。

这期节目没有给出答案,但它明确提出了一个分水岭式的问题:我们到底是在逼近智能,还是在无限逼近一个“看起来像智能的函数”?

总结

这期 a16z Show 真正的价值,不在于它否定了什么,而在于它提醒从业者重新校准直觉。

如果你是研究者,这意味着也许该把一部分注意力,从“再多跑一次实验”转向“我们假设的表示空间是否本身就是错的”。如果你是创业者或工程负责人,这意味着:Scale 当然重要,但它可能只是地基,不是天花板。

一个值得带走的问题是:当模型第一次需要“创造新坐标系”时,我们现在的工具,还能用吗?

谁先认真对待这个问题,谁可能才是真正站在 AGI 门口的人。


关键词: AGI, Scaling Laws, 大语言模型, 深度学习, Anthropic

事实核查备注: 需要核查:视频完整时长;嘉宾的确切身份与姓名;“Einstein test”和“manifold”相关表述是否为原话或意译;对 Anthropic 的评价是否有更具体原句。