x1 fold,diluted 10fold是什么意思( 四 )


但是纯粹从其基因序列中找出蛋白质的三维形状是一项复杂的任务,科学家们已经发现了几十年的挑战 。挑战在于DNA仅包含有关蛋白质构建块序列的信息,称为氨基酸残基,形成长链 。预测这些链如何折叠成蛋白质的复杂3D结构就是所谓的“蛋白质折叠问题” 。
预测蛋白质3D结构模型示意(图片来源:DeepMind官网)
“蛋白质折叠”是一种令人难以置信的分子折叠形式,科学界以外很少有人讨论,但却是一个非常重要的问题 。生物由蛋白质构成,生物体功能由蛋白质形状决定 。理解蛋白质的折叠方式可以帮助研究人员走进科学和医学研究的新纪元 。
因此,蛋白质折叠(Protein Folding)问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题 。蛋白质可在短时间中从一级结构折叠至立体结构,研究者却无法在短时间中从氨基酸序列计算出蛋白质结构,甚至无法得到准确的三维结构 。
美国NIH的Christian Anfinsen博士因为发现蛋白质不需要其他帮助就可以自发地完成蛋白质折叠的过程,于1972年获得了诺贝尔化学奖 。
DeepMind的联合创始人兼首席执行官Demis Hassabis说:“对DeepMind来说,这是一个非常关键的时刻,这是一个‘灯塔’项目,是我们在人员和资源方面的第一项重大投资,同时也是正在成为一个基本的、非常重要的、现实世界的科学问题 。”
早在2017年,美国科罗拉多大学“JILA物理研究中心”的生物物理学家们通过更细致地测量了蛋白质折叠后发现,其折叠过程比科学家们曾经的预测更为复杂 。这意味着,有关蛋白质,我们的了解程度尚在皮毛 。
蛋白质分子的基本组成是氨基酸链 。通过一系列中间过程,像折纸一样,氨基酸链折叠成三维结构,之后才具有功能 。准确地描述这个折叠过程,需要已知所有中间状态的形态 。最新研究就揭示这个过程中许多未知的状态,这一研究成果公布在3月3日的Science杂志上 。
AI如何成功预测蛋白质3D结构?
此次让DeepMind再一次崭露头角的CASP,被认为是蛋白质结构领域“奥林匹克竞赛” 。在这次比赛上,DeepMind团队(参赛名为“A7D”)成功在43个参赛蛋白中拿到25个单项最佳模型,累计总分120.35排名第一 。而根据第13届全球蛋白质结构预测竞赛官方披露的成绩,总分第2名的团队是一支名为“Zhang”的团队,总分为107.03 。
据DeepMind介绍,该项成果的设计源于使用神经网络预测物理特性以及构建蛋白质结构预测的新方法 。
这两种方法都依赖于深度神经网络,这些神经网络经过训练可以从其基因序列中预测蛋白质的特性 。DeepMind的网络预测的属性是:(a)氨基酸对之间的距离和(b)连接这些氨基酸的化学键之间的角度 。第一个发展是对常用技术的进步,这些技术估计氨基酸对是否彼此接近 。
鉴于要研究的新蛋白质,AlphaFold使用神经网络预测氨基酸对之间的距离,以及连接它们的化学键之间的角度 。在第二步中,AlphaFold调整草图结构以找到最节能的布置 。
DeepMind训练了一个神经网络来预测蛋白质中每对残基之间的距离的单独分布 。然后将这些概率组合成评估所提出的蛋白质结构的准确度的分数 。此外,还训练了一个单独的神经网络,该网络使用汇总的所有距离来估计建议的结构与正确答案的接近程度 。

使用神经网络预测物理特性(图片来源:DeepMind官网)
第二种方法通过梯度下降优化得分- 通常用于机器学习的数学技术,用于进行小的、渐进的改进这导致高度精确的结构 。该技术应用于整个蛋白质链而不是在组装之前必须单独折叠的碎片,降低了预测过程的复杂性 。

推荐阅读