“英雄时代结束了”:一位训练过 Claude 和 Gemini 的人,如何看 AI 下半场

AI PM 编辑部 · 2026年05月11日 · 64 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在迷信“更大模型=更强智能”,这期播客会让你不太舒服。Yao Shunyu 讲得很直白:AI 已经进入下半场,决定胜负的,不再是英雄式突破,而是长期、枯燥、甚至有点反直觉的工程判断。

“英雄时代结束了”:一位训练过 Claude 和 Gemini 的人,如何看 AI 下半场

如果你还在迷信“更大模型=更强智能”,这期播客会让你不太舒服。Yao Shunyu 讲得很直白:AI 已经进入下半场,决定胜负的,不再是英雄式突破,而是长期、枯燥、甚至有点反直觉的工程判断。

最反直觉的判断:AI 已经进入“下半场”

真正让人警醒的,不是 Gemini 或 Claude 又涨了多少分,而是 Yao Shunyu 去年反复强调的一句话:AI 已经进入第二阶段。这句话的潜台词是——第一阶段那种靠规模、靠算力、靠“天才直觉”的红利,正在迅速消失。

在上半场,只要你模型够大、数据够多、训练跑得够狠,就能明显领先。但现在,模型能力正在被“抹平”。即便在内部评测中只差一两个百分点,用户的真实体验却往往感知不到那么大的鸿沟。

这不是技术停滞,而是竞争方式变了:从“谁更猛”,变成了“谁更稳、谁更懂人”。真正拉开差距的,是对使用场景的理解、对失败边界的把控,以及对人类行为的细腻洞察。

为什么从硅谷出发,他选择了 Gemini

播客里有个细节很有意思:当被问到在硅谷和同行交流的频率时,话题自然转向了他的职业选择——为什么去 Gemini

这里没有宏大的叙事,反而透露出一种工程师式的冷静判断。对他来说,平台选择不只是“模型强不强”,而是你是否相信这家公司对下半场的理解:是否愿意在漫长、看不到立竿见影回报的方向上持续投入。

这也解释了为什么现在的顶级研究员流动,越来越像是“认知迁移”而不是“跳槽”。他们不是追逐 headline,而是在选择一种更可能活到最后的技术路径。

Claude vs Gemini:差距真的只有那一两分吗?

当聊到具体模型时,Yao Shunyu 给了一个非常克制、但信息量巨大的判断:从他个人的了解来看,Claude 仍然是更通用的模型,优势大概在一两个百分点

注意,这并不是粉黑大战,而是一个行业内部常见、却很少被直说的事实:在核心能力逐渐收敛之后,“更通用”本身就是一种极其昂贵的能力。

而这一两个百分点,往往意味着成倍的时间成本。数据不是点一下就有的,方向也不是拍脑袋决定的。每一次取舍,背后都是长期积累——这也是为什么不同模型会“刻意”选择不同优先级,而不是所有能力一起拉满。

真正的进步,可能只是修好了一个 Bug

播客后半段最容易被忽略,但可能最重要的观点是:有时候,修复一个单一 Bug,带来的进步,比一次大规模训练还要大

这句话几乎和外界的想象完全相反。公众更容易被“参数翻倍”“新架构发布”吸引,但在内部世界里,真正改变模型行为的,可能只是一个看似不起眼的修正。

这也再次印证了“英雄主义结束了”——现在拼的不是谁能一战封神,而是谁能在无数次微调、回滚、再尝试中保持耐心。

当能力被拉平,人的判断重新变得昂贵

当模型能力趋同,技术问题反而变成了人的问题:哪些方向值得优先?哪些能力可以暂缓?哪些体验用户真的在意?

这些问题,无法通过 scaling law 自动给出答案,只能靠经验、试错和对人的理解。这也是为什么 Yao Shunyu 会强调“需要大量人类洞察”。

AI 的下半场,本质上是一个把技术重新交还给人的阶段。

总结

如果你是 AI 从业者,这期内容至少给你三个现实的提醒:第一,不要再指望单点突破解决一切,耐心和系统性比灵感更重要;第二,模型差距正在缩小,真正的护城河是对场景和用户的理解;第三,你的价值,正在从“会不会训练模型”转向“会不会做判断”。

下一个问题留给你:在能力被不断拉平的时代,你的判断力,是否正在变成稀缺资源?


关键词: AI下半场, Gemini, Claude, 模型训练, 工程判断

事实核查备注: 需要核查:Yao Shunyu 关于“AI进入第二阶段”的原话时间点;Claude 相比其他模型“一两个百分点”的具体语境;选择 Gemini 的完整背景是否在视频中有更详细说明