Intercom 用 AI 把工程效率翻倍:不是 Copilot,而是把 AI 当同事

AI PM 编辑部 · 2026年05月15日 · 54 阅读 · AI/人工智能

正在加载视频...

视频章节

Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。

Intercom 用 AI 把工程效率翻倍:不是 Copilot,而是把 AI 当同事

Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。

一家 15 岁 SaaS 公司,在 ChatGPT 发布的那个周末“重生”

Brian Scanlan 一上来就抛出一个狠事实:Intercom 是一家成立 15 年的 B2B SaaS 公司,但它成为“AI 公司”的时间点,精确到 ChatGPT 发布的那个周末。

这不是营销话术。从数据上看,当大量上市 SaaS 公司增长放缓甚至下滑时,Intercom 的收入曲线却明显向上。他们的 AI 客服代理 Finn,在 GPT-4 发布当天上线,如今已经服务了 8000 多家客户,年化收入逼近 1 亿美元。

但 Brian 很快打断了所有想听“产品成功故事”的人:今天不是来讲 Finn 的,也不是来讲模型性能的。真正让 Intercom 脱颖而出的,不是用了哪个前沿模型,而是他们如何用 AI 重新定义“工程是怎么干活的”。

目标很疯狂:不加人,把工程吞吐量直接翻倍

Intercom 对 AI 的态度并不保守。他们很早就用上了 GitHub Copilot,也试过 Cursor、Augment,但结论出人意料:工具有用,但远远不够。

于是工程管理层定下了一个极其激进、甚至有点冒险的目标:2x engineering throughput——在不增加团队规模的前提下,让工程产出翻倍。

他们选了一个非常“工程化”的指标来衡量:每个研发人员产生的代码变更量(code changes per R&D)。不是感受,不是问卷,而是硬指标。

为了这个目标,管理层做了几件很少公司敢做的事:
- 明确写进岗位期望:不使用 AI,就是不达标
- 反复传达同一条信息,而不是发一封邮件就算
- 奖励“用 AI 把事做快做好的行为”,而不是单纯写代码
- 专门配置全职人员,推动 AI 在工程体系内落地

这背后传递的信号非常清晰:AI 不是个人加分项,而是组织级能力。

他们不再选工具,而是选一个“平台型 AI 同事”

Intercom 最关键的转折点,是放弃“让工程师自由选择 AI 工具”,转而统一到一个平台:Cloud Code。

Brian 的一句话很值得回味:“我们需要摆脱 model anxiety(模型焦虑)。”

在他们的设想里,Cloud Code 不是一个插件,而是一个被当作“高级工程师”对待的存在:
- 接入代码库、文档、监控、日志
- 有清晰权限和审计(毕竟是成熟公司)
- 像新人一样被 onboard
- 被要求参与调试、测试、规划、回顾

更重要的是,他们把知识封装成可复用的“skills”。不是让 AI 写某一段代码,而是让它掌握“怎么解决一类问题”。

Brian 反复强调一句原则:“不要给 AI 任务,要给它问题。”

一个安全事故中,Claude 被拉进 Slack 频道,在两分钟内完成了完整分析。这不是奇技淫巧,而是长期把环境、上下文、权限都为 agent 优化后的自然结果。

真正的瓶颈浮现了:不是写代码,而是人类自己

当 PR 数量真的翻倍后,一个更尴尬的现实出现了:代码评审成了最大瓶颈。

Intercom 的解决方式同样激进:把越来越多的审批、回归、合规检查交给 agent。他们已经在做自动审批、回测、标注,甚至用于 SOC 2 和 ISO 合规。

Brian 说了一句极具争议但非常真实的话:“在某些任务上,人类并不比 agent 做得好。”

更重要的是,数据开始反向证明这条路是对的:缺陷关闭速度更快,代码质量在提升,他们甚至在和斯坦福合作做系统性研究。

到演讲结束时,Cloud Code 已经开始“外溢”到工程之外,被产品经理用来构建和验证想法。这已经不是工程效率工具,而是新的工作方式。

总结

Intercom 的故事真正震撼的地方,不在于他们用了多强的模型,而在于他们敢于把 AI 当成“组织成员”来设计系统。对工程团队来说,这意味着工作的重心正在上移:从写代码,到设计问题、构建技能、优化人机协作环境。

如果你是工程负责人,可以立刻自问三个问题:你的团队是否有一个统一的 AI 平台?你是在奖励“写得多”,还是奖励“用 AI 把事做完”?你给 AI 的是零碎任务,还是完整问题?

也许未来拉开差距的,不是谁更会写 prompt,而是谁更早完成了这次工程范式迁移。


关键词: 工程效率, AI Agent, 大语言模型, Intercom, 开发者生产力

事实核查备注: 需要核查:Intercom 员工规模约 1400 人;Finn 客户数量(8000+)与收入接近 1 亿美元的表述;GPT-4 发布当天上线 Finn;代码吞吐量翻倍的具体指标定义;Cloud Code 是否为内部平台名称;与斯坦福合作研究的具体形式。