Sourcegraph CTO谈AI写代码:真正的瓶颈不在模型

AI PM 编辑部 · 2024年01月18日 · 13 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 播客中,Sourcegraph 联合创始人兼 CTO Beyang Liu 回顾了公司从代码搜索到 AI 编程助手 Cody 的演进,并分享了他对“上下文”“代码理解”和 AI 编程未来的关键判断。这不是一场关于模型参数的对话,而是一次关于开发者真实工作流的深度反思。

Sourcegraph CTO谈AI写代码:真正的瓶颈不在模型

在这期 No Priors 播客中,Sourcegraph 联合创始人兼 CTO Beyang Liu 回顾了公司从代码搜索到 AI 编程助手 Cody 的演进,并分享了他对“上下文”“代码理解”和 AI 编程未来的关键判断。这不是一场关于模型参数的对话,而是一次关于开发者真实工作流的深度反思。

从代码搜索出发:一个被低估的开发者痛点

理解 Sourcegraph 和 Cody,必须回到一个看似朴素的问题:为什么写代码这么难进入“心流”。Beyang Liu 回忆,他们在 2013 年创立 Sourcegraph 时,自己和联合创始人都是开发者,长期被一个落差困扰——“编程本应是高效创造,但现实却充满摩擦”。这种痛感并非个例,而是存在于几乎所有行业的软件团队中。

早期的 Sourcegraph 并没有 AI,而是专注于代码搜索和代码理解工具。这个选择本身就很有指向性:在真实的工程环境中,开发者最大的时间消耗并不是敲代码,而是理解已有代码、找到正确的上下文。Beyang 在节目中提到,他至今还记得在 GopherCon 这样的开发者会议上,被反复问到“你们到底怎么提升开发者生产力”。这段经历奠定了 Sourcegraph 的核心假设:如果不能解决代码理解问题,任何更炫的自动化都只是表面效率。

在 AI 之前,就已经在思考“上下文”

播客中一个重要但容易被忽略的转折是:Sourcegraph 并不是在大模型爆发后才开始思考 AI。Beyang 提到,他们在更早的时候就已经在研究神经网络、注意力机制(attention)以及模型如何理解复杂结构。这并非学术好奇,而是直接服务于一个问题——机器如何像人一样读代码。

他强调,当前这一代 AI 真正的突破点,不只是模型变大,而是注意力机制让模型能够在大量信息中抓住关键上下文。但在真实代码库里,“上下文”并不是自然存在的,而是需要被精心挑选和构建的。正因为 Sourcegraph 长期深耕代码搜索和索引,他们反而比很多后来者更早意识到:如果把无关代码一股脑塞给模型,只会让回答更不稳定,甚至更容易“编造”。这也为后来的 Cody 设计埋下了伏笔。

Cody 是什么:不是替你写代码,而是帮你理解代码

当主持人让 Beyang 解释 Cody 是什么时,他给出的定义相当克制。Cody 是一个集成在编辑器里的 AI 编程助手,但它的目标不是炫技式地生成大量代码,而是“构建真正强大的代码理解工具,服务于人类开发者”。

在实际体验层面,Cody 同时结合了传统信息检索和大模型生成。也就是说,它背后既有 Sourcegraph 多年积累的搜索系统,也有语言模型的推理能力。这种混合架构的目的只有一个:尽可能基于真实代码回答问题,而不是凭空发挥。Beyang 在节目中明确表达了一个价值取向——相比“看起来很聪明”,他更在意“回答是否准确、是否少编造”。这在当下的 AI 编程工具中,是一个并不讨巧、但极其重要的立场。

为什么“不中断心流”的体验设计至关重要

讨论到产品体验时,Beyang 特别区分了两种 AI 使用方式:一种是补全(completions),另一种是频繁打断用户、强行推送建议的交互。他的判断非常明确——任何把开发者“拉出心流”的设计,长期来看都是负价值。

这也是 Cody 在设计上的一个核心原则:尽量在开发者已经在做的事情上提供帮助,而不是制造新的注意力负担。无论是回答问题、解释代码,还是生成片段,都应该发生在“合适的时刻”。他直言,很多工具的问题不在模型能力,而在于不理解真实的开发节奏。对 Sourcegraph 来说,AI 不是主角,而是嵌入工作流中的基础设施。

更长期的愿景:为不同任务取“恰到好处的上下文”

在播客接近尾声时,Beyang 把视角拉向了更长期的未来。他认为,真正困难、也真正有价值的问题是:如何针对不同任务,动态地获取“刚刚好”的上下文。不是越多越好,而是越相关越好。

他对此保持谨慎的乐观。一方面,模型正在变得更善于利用输入的上下文;另一方面,如何选择和组织这些上下文,依然是工程系统的核心能力。对开发者而言,这意味着未来的 AI 工具可能不会显得更“吵闹”,反而会更安静、更懂你正在做什么。正如 Beyang 的隐含判断:AI 编程的胜负手,不在模型榜单,而在谁最理解代码和人。

总结

这期对话提供了一个难得的视角:当大多数讨论都围绕模型能力时,Sourcegraph 仍然从开发者体验和代码理解出发思考 AI。Beyang Liu 的核心洞见在于,AI 不是要取代开发者的判断,而是通过更好的上下文,让判断变得更容易。对任何构建 AI 工具或使用 AI 写代码的人来说,这都是一个值得反复咀嚼的提醒。


关键词: Sourcegraph, Cody, AI编程助手, 代码理解, 上下文

事实核查备注: 人物:Beyang Liu(Sourcegraph 联合创始人兼 CTO);公司:Sourcegraph;产品:Cody(AI coding assistant);播客:No Priors;技术概念:代码搜索、代码理解、神经网络、注意力机制、上下文(context)。