Duolingo最反直觉的AI真相:不是更聪明,而是更像人

AI PM 编辑部 · 2025年06月10日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

在这场 Config 2025 的对谈里,Duolingo 早期成员 Natalie Glance 抛出了一个让很多 AI 从业者不安的事实:真正拉开差距的,从来不是模型参数,而是产品文化、实验方法,以及对“人”的极端重视。这不是一场炫技的 AI 演示,而是一堂残酷又实用的产品课。

Duolingo最反直觉的AI真相:不是更聪明,而是更像人

在这场 Config 2025 的对谈里,Duolingo 早期成员 Natalie Glance 抛出了一个让很多 AI 从业者不安的事实:真正拉开差距的,从来不是模型参数,而是产品文化、实验方法,以及对“人”的极端重视。这不是一场炫技的 AI 演示,而是一堂残酷又实用的产品课。

40个人的小团队,决定了今天Duolingo的上限

Natalie Glance 在台上回忆自己加入 Duolingo 的时刻:10 年前,公司只有 40 个人,所有人挤在同一个房间里,彼此知道对方的伴侣、孩子,甚至宠物的名字。听起来像创业鸡汤,但真正重要的不是“温情”,而是由此建立的决策方式。

Duolingo 很早就把“文化”写成一本 handbook,并围绕五个核心原则展开。这些原则并不是挂在墙上的口号,而是直接约束产品和工程决策的边界条件。Natalie 强调了一点:公司在高速增长后,最难的不是招人,而是“持续像一家小公司那样思考”。

这对 AI 团队尤其重要。模型会迭代、技术会过时,但一旦组织习惯于用流程掩盖不确定性、用 KPI 代替判断力,哪怕用上最强的模型,也只能做出平庸的产品。Duolingo 的反直觉之处在于:他们把文化当成一种长期的技术资产。

直觉 vs 数据:Duolingo 如何避免“被 A/B 测试绑架”

当话题转向实验和数据时,Natalie 提到了一个很多增长团队都踩过的坑:不是没有数据,而是数据太多。

Duolingo 是行业里最依赖实验的公司之一,DAU、留存、streak(连续学习天数)都是被反复验证过的“已知杠杆”。但她明确指出:并不是所有东西都适合用实验来决定。真正困难的,是判断什么时候该相信直觉,什么时候该让数据说话。

她举了一个具体例子:团队曾经用一种新机制替换了“hearts”(失败次数限制)。从短期看,这个改动对变现是正向的,但更重要的是,它对 DAU 增长也是正向的——这是一个事后才能被验证的结果。

这里的关键不是机制本身,而是思路:实验不是为了证明你是对的,而是为了快速发现你哪里错了。对 AI 产品来说,这意味着不要迷信一次漂亮的 offline 指标,真正的答案永远在真实用户的行为里。

当大语言模型出现,Duolingo做的第一件事不是“All in”

谈到 AI,Natalie 说了一句非常 Duolingo 的话:AI 一直都在他们的 DNA 里,但 LLM 的出现,改变的是“可能性的边界”。

当 ChatGPT 出现、OpenAI 展示出大语言模型的能力后,Duolingo 并没有立刻把所有东西推翻重来。他们先是 pivot 了一支原本在做“真人导师”的团队,让这支团队专注探索 LLM 能不能真的解决教学中的核心问题。

过程中,他们尝试了很多方向,也失败了不少。Natalie 特意强调:并不是一开始就知道答案,而是在不断试错中,才逐渐找到一个既对学习有效、又在技术和成本上可行的方案。

这对很多 AI 从业者是一个提醒:LLM 不是功能生成器,而是能力放大器。如果你在模型之前就没想清楚“什么是好体验”,模型只会把混乱放大。

从2D到3D,从PM到AI:复杂度正在转移

在后半段的讨论中,话题落到了动画和 PM 的角色变化上。Duolingo 的角色 Lily 目前主要是 2D rig,但团队也在探索 3D 带来的可能性。

Natalie 点出了一个容易被忽视的趋势:AI 并没有让产品变简单,而是把复杂度从“实现”转移到了“决策”。技术上能做的事情越来越多,但 PM、设计师和工程师需要更频繁地协作,去判断哪些能力值得被做进产品。

她提到,现在的 PM 必须理解 AI 的边界,知道模型什么时候可靠、什么时候会“胡说八道”。这不是要求每个人都成为模型专家,而是要求产品团队对 AI 有足够清醒的敬畏。

总结

这场对谈真正有价值的地方,不在于 Duolingo 用了什么模型,而在于他们如何思考不确定性。文化决定了你怎么做实验,实验决定了你是否配得上 AI 的能力。

对 AI 从业者来说,最大的 takeaway 是:别急着追下一代模型,先问问自己——你的团队是否允许失败?你的产品是否真的围绕用户行为而不是技术能力?

未来几年,AI 会继续变强,但只有那些在文化、实验和判断力上打磨足够久的团队,才能把“更聪明的模型”变成“更好的产品”。


关键词: Duolingo, 大语言模型, ChatGPT, 产品文化, AI产品实验

事实核查备注: 需要核查:Natalie Glance 加入 Duolingo 的具体年份;Duolingo 核心文化原则数量;hearts 机制替换的具体时间点;Duolingo 内部 AI 团队从真人导师 pivot 的细节描述;Config 2025 的正式议程信息