人工智能首次预测蛋白质“光学指纹”


人工智能首次预测蛋白质“光学指纹”



采访人员从中国科大获悉 , 该校微尺度物质科学国家研究中心江俊教授与其合作者合作 , 通过利用人工智能机器学习中的神经网络技术 , 模拟了蛋白质肽键结构与性质之间的构效关系 , 大大降低了计算量 , 为预测蛋白质的光学特性提供了一种高效的工具 。 相关成果日前发表在《美国科学院院报》上 。
蛋白质的光谱响应信号 , 尤其是紫外光谱 , 可以称之为蛋白质骨架的“指纹” 。 这个“光学指纹” , 经过理论模拟的解读 , 可以揭示出精确的蛋白质结构 , 为生命科学和医学诊断提供极其重要的信息 。
然而 , 蛋白质的结构极其复杂多变 , 需要做大量的高精度的量子化学理论计算 。 由于计算量太大 , 即使是最厉害的超级计算机也“吃不消” 。 所以蛋白质光谱的理论解读是一个长期的困难与挑战 , 限制了光谱的准确分析和蛋白质结构的发现 。
研究人员首先在300K温度下通过分子动力学模拟以及量子化学计算 , 得到了五万组不同构型的肽键模型分子 。 通过机器学习算法筛选出键长、键角 , 二面角跟电荷信息作为描述符 , 通过神经网络来构建肽键基态结构与其激发态性质之间的构效关系 。 基于训练好的机器学习模型 , 预测出了肽键的基态偶极矩及激发态性质 , 最后预测出肽键的紫外吸收光谱 。 为了验证机器学习模型的鲁棒性 , 研究人员又基于300K的温度下得到的机器学习模型 , 预测出肽键在200K以及400K温度下的紫外吸收光谱 , 其结果与时间密度泛函理论计算结果达到很好的吻合 。
【人工智能首次预测蛋白质“光学指纹”】这是人工智能技术首次用于理论计算预测蛋白质的光谱研究 。 通过理论计算得到大量数据 , 使用人工智能加以训练后 , 确立了机器学习模拟蛋白质肽键骨架紫外吸收光谱的可行性和优势 , 蛋白质的“光学指纹”解读也将会变得更加轻易和有效 。

    推荐阅读