算力越堆越接近AGI？a16z这期节目给了一个相反、却更残酷的答案

AI PM 编辑部 · 2026年03月17日 · 69 阅读 · AI/人工智能

正在加载视频...

视频章节

当整个行业还在相信“再多一点算力、再大一点模型就能通向AGI”时，a16z的一期对谈却直接泼了冷水：Scale 不是解药，甚至可能是陷阱。这期节目讨论的不是工程瓶颈，而是一个更致命的问题——大模型到底懂不懂世界。

当整个行业还在相信“再多一点算力、再大一点模型就能通向AGI”时，a16z的一期对谈却直接泼了冷水：Scale 不是解药，甚至可能是陷阱。这期节目讨论的不是工程瓶颈，而是一个更致命的问题——大模型到底懂不懂世界。

这期 a16z Show 最炸裂的一点，是它几乎正面否定了当前最主流的信念：Scaling Laws 能无限延伸到 AGI。

在过去几年里，行业形成了一种近乎共识的路径依赖——参数更大、数据更多、算力更强，模型就会“自然涌现”出更高层次的智能。但在这次对谈中，嘉宾明确指出：即便数学上、实验上都能证明某些能力随着规模提升而出现，这也不等于你走在通往 AGI 的路上。

原因很简单，却常被忽略：我们验证的，大多还是在同一个问题分布、同一种表示空间里的改进。换句话说，Scale 解决的是“在已知世界里做得更好”，而不是“理解世界本身”。

这也是为什么节目里会反复强调“看起来很 conclusive 的结果”，在更换视角后，其实并不那么稳固——它们证明的是优化能力，而不是认知跃迁。

对话中一个有意思的切口，是对 In-Context Learning 的讨论。

我们已经习惯把它当作大模型的“魔法时刻”：不给梯度更新，只靠 prompt，就能学会新任务。节目里承认——这件事本身确实有效，甚至在某些设定下效果出人意料地好。

但问题也恰恰在这里。

当研究者深入拆解后发现，你可以把 In-Context Learning 理解为某种高度结构化的相关性匹配。它并不是在形成新的因果模型，而是在已有表示空间中，快速找到一个“看起来最像”的解法子空间。

这也解释了一个现实悖论：为什么 LLM 在考试、竞赛、代码生成上表现惊艳，却在稍微改变问题表述、引入新概念时，立刻露出不稳定的一面。

节目中的一句话点得很狠：“它 worked，并不意味着它 understood。”

讨论最锋利的部分，发生在话题从模型机制，转向认知层面。

嘉宾直接点出一个行业心结：几乎所有深度学习，本质上都在做相关性建模。哪怕你把网络堆得再深、参数堆得再多，它仍然是在一个固定的表示假设下，对输入输出分布进行拟合。

而真正的人类智能，恰恰发生在跨越相关性之后——进入因果、组合复杂性和抽象结构的世界。

这也是为什么节目中会提到“Einstein test”。不是因为物理本身，而是因为爱因斯坦做的那件事：他不是在旧坐标系里找到更优解，而是创建了一个全新的流形（manifold）。

如果你只允许模型在“旧的 manifold”里搜索，再多的 scale，也只能得到更极致的插值，而不是范式突破。

节目里对 Anthropic 的评价，其实相当克制但正面：产品做得很好，研究也严肃。

但这并不妨碍一个更大的判断浮出水面——即便是当前最谨慎、最重视对齐的公司，也依然受限于同一套技术范式。

如果未来 AGI 真的需要的是新的表示、新的学习机制、甚至新的数学工具，那么继续把绝大多数资源押注在 scale 上，很可能是一种“看起来最安全、实际上最保守”的选择。

这期节目没有给出答案，但它明确提出了一个分水岭式的问题：我们到底是在逼近智能，还是在无限逼近一个“看起来像智能的函数”？

这期 a16z Show 真正的价值，不在于它否定了什么，而在于它提醒从业者重新校准直觉。

如果你是研究者，这意味着也许该把一部分注意力，从“再多跑一次实验”转向“我们假设的表示空间是否本身就是错的”。如果你是创业者或工程负责人，这意味着：Scale 当然重要，但它可能只是地基，不是天花板。

一个值得带走的问题是：当模型第一次需要“创造新坐标系”时，我们现在的工具，还能用吗？

谁先认真对待这个问题，谁可能才是真正站在 AGI 门口的人。

关键词： AGI， Scaling Laws，大语言模型，深度学习， Anthropic

事实核查备注：需要核查：视频完整时长；嘉宾的确切身份与姓名；“Einstein test”和“manifold”相关表述是否为原话或意译；对 Anthropic 的评价是否有更具体原句。