正在加载视频...
视频章节
这期 No Priors 播客中,Daphne Koller 回顾了自己如何从计算机科学转向生物学,并最终创立 Insitro。她分享了概率图模型的长期影响、在 Calico 的关键反思,以及她如何看待机器学习在真实世界药物研发中的边界与机会。
从概率图模型到药物研发:Daphne Koller 的一次“跨界回归”
这期 No Priors 播客中,Daphne Koller 回顾了自己如何从计算机科学转向生物学,并最终创立 Insitro。她分享了概率图模型的长期影响、在 Calico 的关键反思,以及她如何看待机器学习在真实世界药物研发中的边界与机会。
为什么一个计算机科学家会走向生物学
理解 Daphne Koller 的路径,首先要明白这并不是一次心血来潮的转行,而是一条“延迟出现”的主线。她在播客一开始就提到,自己最初对生物学产生兴趣,并不是因为医学情怀,而是因为技术挑战本身。她回忆说,早期吸引她的是生物系统所蕴含的复杂性——那是一类“天然就需要计算方法才能理解”的问题。
在成为机器学习领域的知名学者多年之后,她才真正投入到生物学应用中。这种“多年之后才回头”的经历,在她看来并不罕见:计算机科学提供的是一套抽象和建模的语言,而生物学恰恰缺乏的正是这种语言。她形容这种跨界是一种“full circle”的体验——早年学到的建模思想,终于找到了一个足够复杂、也足够重要的现实舞台。
她在节目中坦言,这个过程“a lot of fun, amazing”,但背后并不轻松。生物数据噪声大、机制不清晰、因果关系复杂,这些都和教科书里的机器学习问题完全不同。也正是这种差异,让她意识到:如果只是简单套用现有算法,生物学不会真正被改变。
概率图模型的遗产:不是算法,而是思维方式
作为《Probabilistic Graphical Models》一书的作者,主持人自然把话题引向了这一领域。但 Daphne Koller 很快把讨论从“技术成就”拉回到“方法论影响”。在她看来,概率图模型的核心价值不在于某个具体算法,而在于它强迫研究者显式地思考变量之间的结构关系。
她提到,很多现实问题——尤其是生物和医学问题——并不是缺少数据,而是缺少对系统结构的理解。概率图模型提供了一种方式,把不确定性、因果假设和先验知识放在同一个框架里。这种训练,让她在面对复杂疾病问题时,更倾向于先问“系统是如何组成的”,而不是“我该用什么模型”。
她在播客中有一句颇具代表性的表述,大意是:模型本身会过时,但你学会如何拆解一个复杂系统,这件事不会过时。这也解释了为什么她后来会对药物研发产生兴趣——那是一个长期依赖经验、但极度需要结构化理解的领域。
Calico 的 18 个月:一次关键但不完美的尝试
在正式创立 Insitro 之前,Daphne Koller 曾在 Calico 工作了大约 18 个月。她在节目中明确指出,这段经历对她后来的判断至关重要。Calico 拥有雄厚资源和顶尖人才,但也让她第一次近距离看到,生物医学研究中哪些问题“光靠聪明和钱是解决不了的”。
她回忆说,正是在 2016 年前后,她开始系统性地反思:机器学习究竟应该在药物研发的哪个环节发挥最大价值?哪些问题是当前技术根本不适合碰的?她形容这种反思是“take a step back and reflect”,而不是一味向前冲。
最终,她选择离开 Calico,自行创业。这并不是对原有工作的否定,而是意识到如果要真正重构研发流程,需要从组织、数据和问题定义上同时入手。这种判断,直接催生了 Insitro 的诞生。
Insitro 的核心判断:不要把机器学习当万能钥匙
谈到 Insitro 的工作重点时,Daphne Koller 反复强调“聚焦”。她提到,公司并不是简单地在所有疾病、所有数据类型上全面铺开,而是选择那些机器学习“最可能改变结果”的切入点。她直言:“it’s really hard”,因为疾病机制复杂、临床转化周期极长,任何过度承诺都会反噬团队。
她把当前的工作大致分为几类,其中一类是高内容数据(high-content data),例如细胞成像等。这类数据维度高、结构复杂,非常适合机器学习,但前提是实验设计本身足够严谨。她提醒说,如果数据生成过程本身不可控,再强的模型也只是在放大噪声。
在节目接近尾声时,她再次回到一个朴素但重要的观点:机器学习在生物医学中的价值,最终要用患者结果来衡量,而不是论文或模型指标。“as long as it takes”,她愿意接受这是一场长期战役。
总结
这期播客并不是一次炫耀技术的访谈,而是一位顶级学者对自身路径的冷静复盘。Daphne Koller 提供的最大价值,不是某个具体模型或结论,而是一套判断框架:什么时候该前进,什么时候该后退;哪些问题值得用机器学习,哪些暂时不值得。对任何试图将 AI 带入复杂现实世界的从业者来说,这种克制本身,就是最稀缺的洞见。
关键词: Daphne Koller, Insitro, 概率图模型, 机器学习, 药物研发
事实核查备注: 人物:Daphne Koller;公司:Calico、Insitro;时间节点:2016 年前后、在 Calico 约 18 个月;技术概念:Probabilistic Graphical Models(概率图模型)、machine learning、high-content data;节目来源:No Priors Ep. 6