从蛋白质进化到AlphaFold:Dmitry Korkin谈生命与AI的隐秘逻辑

AI PM 编辑部 · 2021年01月11日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期Lex Fridman播客中,计算生物学家Dmitry Korkin从蛋白质进化谈到病毒、生命复杂性,再延伸至神经网络与AlphaFold等AI突破,提出一个贯穿生命与人工智能的核心观点:复杂性不是偶然,而是由可重用的模块逐步堆叠而来。

从蛋白质进化到AlphaFold:Dmitry Korkin谈生命与AI的隐秘逻辑

在这期Lex Fridman播客中,计算生物学家Dmitry Korkin从蛋白质进化谈到病毒、生命复杂性,再延伸至神经网络与AlphaFold等AI突破,提出一个贯穿生命与人工智能的核心观点:复杂性不是偶然,而是由可重用的模块逐步堆叠而来。

为什么理解蛋白质“模块化”如此重要

如果想真正理解生命是如何演化的,蛋白质是绕不开的一层。Korkin在对话一开始就强调,人们常说“蛋白质决定功能”,但更关键的是蛋白质内部的结构单元——蛋白质结构域(protein domains)。结构域可以理解为蛋白质中的“功能模块”,它们在不同蛋白中被反复使用、重新组合。

他指出,一个被忽视的事实是:进化并不是每次都“从零开始”设计新蛋白,而是大量复用已有结构域。这种模块化思维解释了为什么生命系统能在保持稳定的同时不断产生新功能。Korkin形容这种机制时提到,进化更像是在“搭乐高”,而不是“从一整块石头里雕刻雕像”。

这一视角之所以重要,是因为它直接影响我们如何研究疾病、药物以及病毒变异。如果忽略结构域层面的复用与演化,就很难理解某些蛋白为何在不同物种中高度相似,却承担着略有差异的功能。

蛋白质复合体:被低估的生命复杂性来源

在讨论中,Korkin多次把话题从单个蛋白“拉远”,转向蛋白质复合体(protein complex)。复合体是多个蛋白的聚集体,它们协同工作,完成单个蛋白无法胜任的任务。Lex Fridman追问:“为什么这些很少被大众讨论?”

Korkin的回答很直接:因为它们太复杂了。复合体不仅数量庞大,而且其相互作用关系高度动态,这让实验和建模都异常困难。但正是这些复合体,构成了细胞中真正的功能核心。

他提到,在药物设计中,理解复合体尤为关键。针对单一蛋白的药物,往往忽略了它在复合体中的位置与作用,从而带来副作用。复合体同时也意味着“更大的攻击面”,无论是对病毒入侵,还是对治疗干预,复杂性既是风险,也是机会。

可变性、剪接与进化的“效率问题”

谈到进化,Korkin提出一个耐人寻味的问题:哪些部分是“可突变的”,哪些不是?他解释说,从进化效率角度看,并非所有区域都适合频繁变化。某些核心结构一旦改变,整体功能就会崩溃,这在进化中是“代价极高”的。

在这里,他引入了可变剪接(alternative splicing)的概念——同一个基因可以通过不同剪接方式生成多种蛋白产物。这被视为生命提高“性价比”的策略:在不增加基因数量的情况下,扩展功能空间。

Korkin特别指出,这种机制并非完美。有些剪接产物其实效率很低,甚至只是进化过程中的“副产品”。但正是这些看似低效的尝试,为复杂生命形式提供了探索新功能的空间。

从生命到AI:AlphaFold与可学习的复杂性

对话的后半段,自然过渡到了人工智能。Korkin被问及对AlphaFold 2的看法时,毫不掩饰兴奋之情,称其为“一个巨大的飞跃”。AlphaFold 2通过神经网络解决了长期困扰生物学界的蛋白质折叠问题。

但他也保持了科学家的克制。当话题转向多蛋白折叠(multi-protein folding)时,Korkin坦言,这个问题要难得多,目前仍远未解决。不过,他提出一个乐观的判断:如果单蛋白折叠可以被学习,那么更复杂的系统“原则上也可能被学习”。

在一个颇具哲学意味的时刻,他把这一切与德雷克方程联系起来,认为理解复杂系统的能力,可能决定我们是否能真正理解生命,甚至宇宙中的其他生命形式。“这真的非常令人兴奋。”他这样评价AI与生命科学交汇的未来。

总结

这场对话的价值,不在于给出确定答案,而在于提供了一种贯穿生命与AI的思维方式:复杂系统并非不可理解,而是由可重用、可演化的模块逐步构建而成。无论是蛋白质结构域、复合体,还是神经网络模型,背后都有相似的逻辑。对读者而言,最大的启发或许是:理解复杂性,不必畏惧宏大问题,而应从模块、关系与演化路径入手。


关键词: 蛋白质进化, 蛋白质复合体, 可变剪接, AlphaFold 2, 神经网络

事实核查备注: Dmitry Korkin(受访者);Lex Fridman Podcast #153;protein domains(蛋白质结构域);protein complex(蛋白质复合体);alternative splicing(可变剪接);AlphaFold 2;multi-protein folding;Drake Equation;神经网络