AI再发力,解决困扰生物学家近50年的一个基本问题


AI再发力,解决困扰生物学家近50年的一个基本问题



蛋白质的折叠 , 好似折纸 , 不同结构决定了不同功能 。 而AI似乎觑得了其中秘密 。 |DeepMind
作者|陆修远
我们的生命离不开蛋白质 。 蛋白质是一切生命活动的基础物质 , 它是运输氧气的载体 , 是帮助抵御病毒的抗体 , 也是消化食物的酶 。 蛋白质之所以能够承担多种多样的功能 , 很大程度上是因为它们具有丰富而复杂的空间结构 。
可是 , 蛋白质如何折叠成这些独特的形状呢?这是生物学领域的一个重大挑战 , 已经困扰科学家们近50年时间 。 而就在最近 , 谷歌开发的人工智能系统 AlphaFold 将蛋白质结构预测的准确度提高到了原子水平 , 可以说基本解决了这个“蛋白质折叠问题” 。 这比许多科学家的预期还要早几十年 , 显示出 AI 对解决重大科学问题的潜力 。
01.
困扰科学家近50年的难题
蛋白质占据我们每个人体重的大约20% , 是除水分(60%)以外第二多的物质种类 , 其它的脂质、碳水化合物、核酸以及各种无机物加起来 , 也仅仅占到20% 。 蛋白质在人体中含量如此之高并不奇怪 , 因为蛋白质是生命活动的主要承担者 , 没有蛋白质就没有生命 。
人类的生命活动须臾都离不开蛋白质的参与 。 无论是身体收缩肌肉、眼睛感知光亮 , 还是消化系统将将食物转化为能量 , 我们身体的每一项功能之所以能够正常行使 , 几乎都依赖于蛋白质 。
生命的每一项活动都依赖于蛋白质 。 左下为红细胞 , 右下为抗体蛋白 。 |图虫创意
目前地球上已知的蛋白质大约有两亿种 , 每一种蛋白质都有独特的空间结构 。 蛋白质在生物体中能够发挥多种多样的功能 , 很大程度上取决于它们的三维结构 。
例如 , 我们免疫系统中的抗体蛋白是“Y形”的 , 并且会形成独特的钩状 , 这使得它们能够附着在病毒和细菌上 , 检测和标记致病微生物 , 将其彻底消灭 。 胶原蛋白的形状像拧起来的绳索 , 因而能够在软骨、韧带、骨骼和皮肤之间传递张力 。 还有在被称为“基因魔剪”的 CRISPR-Cas9 基因编辑技术中 , Cas9 蛋白质利用 CRISPR 基因序列作为向导 , 像剪刀一样灵巧地剪切和粘贴 DNA 片段 。
然而 , 确定蛋白质的空间结构一直是生物学中的巨大挑战 。 1972年 , 也就是将近50年前 , 诺贝尔化学学奖得主 Christian Anfinsen 就猜测 , 蛋白质的氨基酸序列应该可以完全决定其空间结构 。 可是要如何根据蛋白质的氨基酸序列来确定它的空间结构呢?这就是困扰科学家们近50年的“蛋白质折叠问题” 。
02.
蛋白质如何将自己折叠起来?
蛋白质就像是一台精心组装的机器 , 它的零件是我们身体内的20种氨基酸 。 在基因编码合成氨基酸序列的过程中 , 一个个氨基酸分子遵照基因序列中蕴含的遗传信息指令 , 像珠子一样有序缀连起来 , 形成多肽链 , 构成蛋白质的一级结构 。
然而 , 通常的机器只要按照设计图将零件组装起来就可以运转 , 而氨基酸分子连接成多肽链后 , 蛋白质分子的建造还没有结束 , 它还需要进一步折叠出空间结构才能发挥功能 。 可是基因序列只决定氨基酸序列的合成 , 并不包含更多信息指导它如何折叠成独特的三维结构 。
事实上 , 氨基酸序列的折叠方式蕴含在自身之中 , 它们自己设计自己如何折叠 。 一维多肽链中的氨基酸分子像是懂得彼此沟通一样 , 它们有些相互排斥 , 有些彼此吸引 , 形成螺旋、折叠成褶皱 , 构成蛋白质的二级结构 。 接着 , 它还会进一步折叠成独特的空间结构 , 像一根毛线绕成线团那样 , 构成蛋白质的三级结构 。

推荐阅读