喝着健力士聊 AGI:Devin 背后的 CEO,比你想的冷静得多

AI PM 编辑部 · 2025年08月27日 · 6 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人都在高喊“AGI 近在眼前”时,Cognition CEO Scott Wu 却一边倒健力士、一边反复强调:真正难的不是模型能力,而是“把 AI 变成能长期干活的工程师”。这场 Stripe Sessions 的聊天,藏着 AI 创业者最该听懂的几句话。

喝着健力士聊 AGI:Devin 背后的 CEO,比你想的冷静得多

当所有人都在高喊“AGI 近在眼前”时,Cognition CEO Scott Wu 却一边倒健力士、一边反复强调:真正难的不是模型能力,而是“把 AI 变成能长期干活的工程师”。这场 Stripe Sessions 的聊天,藏着 AI 创业者最该听懂的几句话。

最反差的开场:一杯健力士,和一个不焦虑的 AGI 创始人

视频一开始就不太“硅谷”。主持人和 Scott Wu 讨论的不是参数规模,也不是最新 benchmark,而是——你喝过健力士吗?泡沫该怎么倒。

这种松弛感贯穿了整场对话,也构成了第一个反差:在 AGI 话题被集体加速、被不断提前时间表的当下,Cognition 的 CEO 却显得异常冷静。

Scott 并没有在开头抛出宏大愿景,而是用一种近乎随意的方式进入话题。这种姿态背后,其实透露出 Cognition 的核心立场:他们并不急着证明“AI 已经多聪明”,而是更在意“AI 是否真的能持续把事情做完”。

对 AI 从业者来说,这是一个重要信号——当最靠近前沿的人开始降噪,说明行业正在从 hype 转向耐力赛。

从 IOI 金牌到 AI 创业:数学不是光环,是耐受训练

聊到个人经历时,Scott Wu 的背景并不陌生,却依然有信息量。

他来自路易斯安那州巴吞鲁日,三次参加 IOI(国际信息学奥林匹克竞赛),并拿到金牌。听起来是典型的“天才履历”,但他自己强调的并不是成绩,而是长期和难题相处的能力

他提到,自己曾经在正式进入职业道路前选择 gap year,去探索真正感兴趣的问题。后来回头看,他轻描淡写地说了一句:“It turns out there's some math in AI.”

这句话的潜台词很明确:
- AI 不是靠灵光一现
- 而是靠长期对复杂系统的拆解能力

对比今天大量“Prompt 工程速成”“模型调参秘籍”,Scott 的经历更像是在提醒:真正拉开差距的,是你能否在长期不确定性中持续推进。

什么是 Cognition?他们真正想做的不是模型,而是“工程师”

当话题转向 Cognition 和 Devin,对话开始变得具体。

Scott 对“Cognition 是什么”的解释,并没有用太多技术术语。他反复强调的一点是:Devin 的目标不是在某个 benchmark 上赢,而是能像工程师一样,接任务、推进、修错、交付。

这也是为什么他在谈指标(metrics)时显得相当克制。相比炫耀某个分数,他更关心的是:
- Devin 能否在真实代码库中持续工作
- 能否在中途失败后自己修复
- 能否在较少人类介入的情况下完成闭环

他明确提到,确实存在一些模型在特定 benchmark 上表现更好,但那并不等同于“更像工程师”。

这是一个对行业很“泼冷水”的判断:

如果你的评估方式本身就偏向短任务,那你永远训练不出能长期干活的 AI。

对正在做 AI 应用、Agent 或自动化工具的团队来说,这几乎是一条方法论级别的提醒。

关于 AGI 时间表:不唱衰,也不许愿

当主持人直接抛出 AGI 时间线的问题时,Scott 的回答依旧保持了这种“去情绪化”的风格。

他并没有给出一个具体年份,而是强调:至少在未来几年,更重要的是信息是否充分、决策是否基于真实反馈。

他的潜在逻辑是:
- 预测 AGI 时间,本身并不会让 AGI 更快到来
- 但错误的预期,会让公司和个人做出糟糕决策

在他看来,当前阶段更现实的进展,是 AI 在软件工程中的角色逐步从“辅助”走向“承担责任”。但这个过程,比大多数人想象得慢,也更依赖系统工程,而不仅是模型能力。

这也解释了他对 Devin 进展的态度:不是没做出来,而是宁愿慢一点,把长期问题解决掉。

从 Windsurf 到生态合作:AI 工具正在走向组合拳

在后半段,Scott 也谈到了与 Windsurf 的关系。他用的词是“natural compliments”——自然互补。

这背后反映的是一个趋势:单点 AI 工具的时代正在过去,真正有价值的是能嵌入工作流的组合。

Devin 不是孤立存在的模型,而是需要:
- 编辑器
- 代码管理
- 部署与测试环境

这些拼图凑在一起,AI 才可能真正替代部分工程劳动。

对创业者来说,这意味着机会;对从业者来说,这意味着你需要理解的不再只是“模型怎么用”,而是“系统怎么协作”。

总结

这场对话最有价值的地方,并不在于某个金句,而在于 Scott Wu 一以贯之的克制态度:不被 benchmark 带节奏,不为 AGI 时间表下注,把全部注意力放在“AI 是否真的能长期干活”上。

对 AI 从业者的 takeaway 很明确:
1) 如果你在做产品,评估体系比模型选择更重要;
2) 如果你在学技术,系统工程能力正在重新变得稀缺;
3) 如果你在规划职业,不要被过度乐观或悲观叙事左右。

真正的分水岭,可能不是 AGI 到来的那一天,而是谁先把 AI 变成可靠的“同事”


关键词: Cognition, Devin, AI 工程师, AGI 时间线, AI 创业

事实核查备注: 需要核查:1) Scott Wu 的 IOI 参赛次数及是否为金牌;2) 视频具体发布时间是否为 2025-08-27;3) Scott 对 Devin 指标与 benchmark 的原话表述;4) Cognition 与 Windsurf 的合作性质描述是否与视频一致。