Anthropic CEO 的最大赌局:AI 指数曲线,真的快到头了吗

AI PM 编辑部 · 2026年02月13日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为 AI 的指数增长已经开始放缓,Dario Amodei 可能会同意你一半,但反对你另一半。在这场对话中,他一边承认我们正逼近某些极限,一边又抛出一个更危险的判断:真正决定胜负的,不再是算力,而是验证、强化学习,以及谁能活到下一轮。

Anthropic CEO 的最大赌局:AI 指数曲线,真的快到头了吗

如果你以为 AI 的指数增长已经开始放缓,Dario Amodei 可能会同意你一半,但反对你另一半。在这场对话中,他一边承认我们正逼近某些极限,一边又抛出一个更危险的判断:真正决定胜负的,不再是算力,而是验证、强化学习,以及谁能活到下一轮。

三年后再回头:指数曲线没有停,但形状变了

Dwarkesh Patel 一开场就把时间拨回三年前。那时,Dario Amodei 说过一句后来被反复引用的话:我们可能“接近指数的末端”。三年过去了,模型确实更强了,但不再是那种一眼就能看懂的线性外推。

Dario 的态度很微妙。他没有推翻当年的判断,反而补充了一个更重要的限定条件:指数增长还在,但你必须问清楚——指数增长的到底是什么? 是参数规模?训练算力?还是模型在真实世界任务中的有效能力?

他的核心假设至今未变:能力仍在指数上升,只是曲线的“投影维度”变了。过去你只要砸算力、堆数据,就能看到几乎确定性的回报;现在,你得先搞清楚自己在爬哪一座山。

从预训练到强化学习:Scaling Law 正在“迁移”

真正让从业者竖起耳朵的,是他对强化学习的判断。

过去十年,预训练 scaling laws 几乎成了行业信条:模型更大、数据更多,效果就更好。但 Dario 指出,一个被低估的事实是——类似的 scaling 正在强化学习中重现

这不是简单地“多跑几轮 RL”。关键在于,强化学习开始承担起“把潜在能力转化为可验证能力”的角色。你不只是让模型会答,而是让它在一个可以被检查、被纠错的框架里反复逼近正确。

他提到 Rich Sutton,并认可那条老生常谈却依然锋利的观点:通用方法 + 规模,长期来看总是赢家。只是今天,这个“通用方法”的重心,正在从无监督预训练,滑向带验证信号的强化过程。

90 到 100 的距离:为什么进步会变慢,但不会停

一个特别反直觉的判断出现在关于“90 到 100”的讨论里。

Dario 认为,从“几乎可用”到“真正可靠”的跨越,确实会比从 0 到 90 慢。这不是因为技术枯竭,而是因为验证成本在急剧上升。你越接近满分,就越难证明自己真的没错。

但他同时强调,这种放缓不是无限的。模型一旦能显著提升人类生产力,就会反过来加速自身的改进速度:研究者更高效,实验迭代更快,组织学习曲线被整体抬升。

换句话说,放缓发生在单次突破上,但系统层面的进化速度,依然可能维持在一个让人不安的水平。

最高风险的商业模型:撑不到分化那一刻就会出局

标题里的“最高风险”,并不是夸张。

在 Dario 的描述中,AI 公司面临的不是温和竞争,而是一场耐力赛。如果你对技术拐点的判断是一到三年,而你又没能撑到模型真正分化的那一刻——结局只有一个:破产。

他明确指出,模型市场最终会比云服务更分化,但问题在于,中间这段“还没分化、但烧钱最快”的时间窗口,足以淘汰大多数玩家。

这也解释了为什么 Anthropic 把注意力放在长期能力和验证框架上,而不是短期 benchmark 的你追我赶。因为在他看来,很多基准最终会被彼此‘过拟合’,而真正重要的,是你是否在为下一阶段的能力跃迁打地基。

政府、价值观与不可预测的变量

当话题转向政府介入时,Dario 的语气明显更谨慎。

他最担心的不是某一条具体政策,而是“初始条件”:一旦在技术尚未成熟时形成错误的制度路径,整个系统可能会被锁死在一个次优解上。

更难的是,有些关键变量几乎无法提前预测。历史上,真正改变技术轨迹的,往往不是我们反复讨论的那些显性风险,而是一些被忽略的小决策。

所以在对话的最后,他把问题抛回给价值观:当 AI 继承并放大人类能力时,我们希望它携带什么样的默认立场?这个问题,没有一个能写进白皮书的简单答案。

总结

这次对话真正值得反复琢磨的,不是某个时间点的预测,而是一种判断世界的方式:不要只盯着曲线有没有变平,而要问曲线代表的变量是否已经换了。

对从业者来说,直接的 takeaway 很现实:如果你还只把注意力放在规模,而忽视验证、强化学习和组织耐力,你可能连参与下一轮竞争的资格都没有。真正的风险,不是进步变慢,而是你以为它会按旧剧本继续。


关键词: Dario Amodei, Anthropic, Scaling Laws, 强化学习, AI 商业模式

事实核查备注: 需要核查:1)Dario Amodei 三年前关于“接近指数末端”的原始表述;2)视频中关于预训练与强化学习 scaling 的具体措辞;3)关于公司破产时间窗口的时间范围是否有明确数字;4)涉及政府介入的具体担忧是否有原话支持。