Anthropic CEO 的最大赌局：AI 指数曲线，真的快到头了吗

AI PM 编辑部 · 2026年02月13日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为 AI 的指数增长已经开始放缓，Dario Amodei 可能会同意你一半，但反对你另一半。在这场对话中，他一边承认我们正逼近某些极限，一边又抛出一个更危险的判断：真正决定胜负的，不再是算力，而是验证、强化学习，以及谁能活到下一轮。

如果你以为 AI 的指数增长已经开始放缓，Dario Amodei 可能会同意你一半，但反对你另一半。在这场对话中，他一边承认我们正逼近某些极限，一边又抛出一个更危险的判断：真正决定胜负的，不再是算力，而是验证、强化学习，以及谁能活到下一轮。

Dwarkesh Patel 一开场就把时间拨回三年前。那时，Dario Amodei 说过一句后来被反复引用的话：我们可能“接近指数的末端”。三年过去了，模型确实更强了，但不再是那种一眼就能看懂的线性外推。

Dario 的态度很微妙。他没有推翻当年的判断，反而补充了一个更重要的限定条件：指数增长还在，但你必须问清楚——指数增长的到底是什么？ 是参数规模？训练算力？还是模型在真实世界任务中的有效能力？

他的核心假设至今未变：能力仍在指数上升，只是曲线的“投影维度”变了。过去你只要砸算力、堆数据，就能看到几乎确定性的回报；现在，你得先搞清楚自己在爬哪一座山。

真正让从业者竖起耳朵的，是他对强化学习的判断。

过去十年，预训练 scaling laws 几乎成了行业信条：模型更大、数据更多，效果就更好。但 Dario 指出，一个被低估的事实是——类似的 scaling 正在强化学习中重现。

这不是简单地“多跑几轮 RL”。关键在于，强化学习开始承担起“把潜在能力转化为可验证能力”的角色。你不只是让模型会答，而是让它在一个可以被检查、被纠错的框架里反复逼近正确。

他提到 Rich Sutton，并认可那条老生常谈却依然锋利的观点：通用方法 + 规模，长期来看总是赢家。只是今天，这个“通用方法”的重心，正在从无监督预训练，滑向带验证信号的强化过程。

一个特别反直觉的判断出现在关于“90 到 100”的讨论里。

Dario 认为，从“几乎可用”到“真正可靠”的跨越，确实会比从 0 到 90 慢。这不是因为技术枯竭，而是因为验证成本在急剧上升。你越接近满分，就越难证明自己真的没错。

但他同时强调，这种放缓不是无限的。模型一旦能显著提升人类生产力，就会反过来加速自身的改进速度：研究者更高效，实验迭代更快，组织学习曲线被整体抬升。

换句话说，放缓发生在单次突破上，但系统层面的进化速度，依然可能维持在一个让人不安的水平。

标题里的“最高风险”，并不是夸张。

在 Dario 的描述中，AI 公司面临的不是温和竞争，而是一场耐力赛。如果你对技术拐点的判断是一到三年，而你又没能撑到模型真正分化的那一刻——结局只有一个：破产。

他明确指出，模型市场最终会比云服务更分化，但问题在于，中间这段“还没分化、但烧钱最快”的时间窗口，足以淘汰大多数玩家。

这也解释了为什么 Anthropic 把注意力放在长期能力和验证框架上，而不是短期 benchmark 的你追我赶。因为在他看来，很多基准最终会被彼此‘过拟合’，而真正重要的，是你是否在为下一阶段的能力跃迁打地基。

当话题转向政府介入时，Dario 的语气明显更谨慎。

他最担心的不是某一条具体政策，而是“初始条件”：一旦在技术尚未成熟时形成错误的制度路径，整个系统可能会被锁死在一个次优解上。

更难的是，有些关键变量几乎无法提前预测。历史上，真正改变技术轨迹的，往往不是我们反复讨论的那些显性风险，而是一些被忽略的小决策。

所以在对话的最后，他把问题抛回给价值观：当 AI 继承并放大人类能力时，我们希望它携带什么样的默认立场？这个问题，没有一个能写进白皮书的简单答案。

这次对话真正值得反复琢磨的，不是某个时间点的预测，而是一种判断世界的方式：不要只盯着曲线有没有变平，而要问曲线代表的变量是否已经换了。

对从业者来说，直接的 takeaway 很现实：如果你还只把注意力放在规模，而忽视验证、强化学习和组织耐力，你可能连参与下一轮竞争的资格都没有。真正的风险，不是进步变慢，而是你以为它会按旧剧本继续。

关键词： Dario Amodei， Anthropic， Scaling Laws，强化学习， AI 商业模式

事实核查备注：需要核查：1）Dario Amodei 三年前关于“接近指数末端”的原始表述；2）视频中关于预训练与强化学习 scaling 的具体措辞；3）关于公司破产时间窗口的时间范围是否有明确数字；4）涉及政府介入的具体担忧是否有原话支持。