AI 编程真相:为何聪明工具反而让人更慢
正在加载视频...
视频章节
一项引发争议的研究称:使用 AI 编程工具的开发者,速度反而慢了 19%。但视频作者指出,问题不在 AI,而在学习曲线、工作流错配和媒体误读。真正的结论,远比“AI 降效”复杂得多。
AI 编程真相:为何聪明工具反而让人更慢
一项引发争议的研究称:使用 AI 编程工具的开发者,速度反而慢了 19%。但视频作者指出,问题不在 AI,而在学习曲线、工作流错配和媒体误读。真正的结论,远比“AI 降效”复杂得多。
一项“反直觉”的研究,为何引爆争论
为什么这很重要?因为它直接挑战了“AI 必然提升生产力”的行业共识。视频一开始就抛出结论:在一组受控实验中,开发者使用 AI 编程工具后,“19% less productive,19% slower”。这不是传闻,而是来自一项被广泛转发的研究。
研究由 MET 的研究人员完成,他们测试了 16 名具备“中等 AI 技能”的开发者,在数百个任务中随机允许或禁止使用 AI。结果非常刺眼:平均来看,允许 AI 的任务完成时间更长。作者在视频中坦言:“你可以听出我已经准备好要批评这项研究了。”但他并没有直接否定数据,而是提醒观众,问题可能出在我们如何理解这些数据。
这项研究之所以引爆,是因为它击中了市场和舆论的敏感神经。主流媒体迅速将其简化为“AI 工具让开发者变慢 19%”,这种标题式结论,远远超出了研究本身的边界。
慢的不是写代码,而是围绕 AI 的新开销
理解“慢在哪里”,比结论本身更重要。研究者通过屏幕录制拆解了时间分布,发现一个关键变化:主动编码时间下降了,但“idle overhead time”显著上升。这些时间被消耗在写提示、等待生成、以及审查 AI 输出上。
研究将减速原因归纳为五类:过度乐观、代码不熟悉、上下文窗口限制、模型可靠性问题,以及代码仓库本身的复杂性。比如,上下文窗口(模型一次能理解的代码量)不足,迫使开发者反复解释背景;而在大型、成熟的仓库中,AI 往往无法准确把握隐含约定。
作者强调,这并不意味着 AI 无用。研究者自己也明确写道:“This slowdown does not imply AI tools don’t improve productivity in many settings。”限制条件非常具体:仓库规模和熟悉度,是当前 AI 工具的硬天花板。
真正的分歧:这是 AI 的问题,还是学习曲线?
争论的核心,其实不在数据,而在解释框架。EMTT Shear 提出,研究更多反映的是学习期成本:开发者在“学会如何用 AI 工作”之前,本来就会更慢。一个耐人寻味的细节是:16 人中,唯一一个有超过一周 Cursor 使用经验的开发者,反而是更快的。
研究者 David Rean 为方法辩护,认为参与者具备“中等 AI 经验”。但视频作者强烈反对这一等同关系,他指出:“和 LLM 聊天,并不等于会用 agentic IDE。”在他看来,40 小时的使用时间,远谈不上掌握。
这里的洞见很尖锐:AI 编程不是加速旧流程,而是引入一种新流程。你从连续写代码,变成了设计指令、等待生成、再大量调试。正如视频中所说,“coding with AI is a different type of work”。
被忽略的变量:模型代际与工具进化
如果忽略时间背景,这项研究很容易被误读。研究使用的是“今年年初的模型”,而多位参与者都反馈,新一代模型“vastly more capable”。作者指出,Agent 能力和 IDE 深度集成的进展,很可能已经让部分减速现象失效。
此外,样本本身也存在明显局限:16 名开发者,多数在大型、成熟代码库中工作,而这恰恰是当前 AI 工具最不擅长的环境。作者直言,这类专家用户“are a poor fit for current AI tools”,因此很难将结果泛化到更广泛的开发者群体。
遗憾的是,这些限定条件在传播中被迅速抹平,留下的只是一句足以制造恐慌的数字。
总结
这项研究的价值,并不在于证明“AI 让人变慢”,而在于揭示成本出现在哪里。AI 带来的生产力提升,伴随着陡峭的学习曲线和工作流重构。真正成熟的结论是:不要因为短期减速而放弃工具,而要投入时间建立新习惯。正如视频隐含的态度——强大的工具,从来都需要时间去驯服。
关键词: AI编程工具, 开发者生产力, 学习曲线, Agentic IDE, Cursor
事实核查备注: 关键事实包括:研究样本为 16 名开发者;结果显示使用 AI 后平均慢 19%;研究者来自 MET;使用屏幕录制分析时间分布;五类减速原因;产品 Cursor;人物 EMTT Shear、David Rean;研究使用的是今年年初的模型版本。