病毒会“逃跑” “语言”露马脚( 二 )


此外 , 该模型可以在相对少量的信息上进行训练——在这项研究中 , 研究人员使用了6万条HIV序列、4.5万条流感序列和4000条冠状病毒序列 。
“语言模型非常强大 , 因为它们可以学习这个复杂的分布结构 , 并从序列变化中获得一些对功能的洞见 。 ”Hie告诉采访人员 , “我们在每个氨基酸位置都有大量的病毒序列数据 , 模型通过训练数据学习氨基酸共现和共变的这些特性 。 ”
一旦该模型被训练 , 研究人员能使用它来预测冠状病毒刺突蛋白、HIV包膜蛋白和流感血凝素(HA)蛋白的序列变化 , 这些蛋白或多或少可能产生逃逸突变 。
“发现看似不相关的科学分支之间的联系 , 可能会发展出来加速一个分支研究的新方法 。 该研究提供了一个此类联系的示例 。 作者们发现了病毒与自然语言之间的相似之处 , 进而提出了一种识别突变的强大新方法 , 这种突变可以使病毒通过中和抗体而逃脱识别 。 ”未参与该研究的美国国家医学图书馆Teresa M. Przytycka等人在相关评论文章中指出 。
知己知彼 阻断逃逸
对于流感 , 该模型揭示了最不可能发生突变和产生病毒逃逸的序列是在HA蛋白的茎部 。 这与最近的研究一致 , 研究表明 , 针对HA茎部的抗体可以提供几乎全面的保护 , 以对抗任何流感毒株 。
在对HIV的研究中 , 研究人员发现 , 该蛋白的V1-V2高变区域有许多可能的逃逸突变 , 这与之前的研究结果一致 , 他们还发现了逃逸概率较低的序列 。
该模型对冠状病毒的分析表明 , 被称为S2亚基的刺突蛋白的一部分最不可能产生逃逸突变 。 但新冠病毒变异的速度仍是一个问题 , 因此目前部署的抗击新冠肺炎大流行的疫苗将在多长时间内保持有效尚不清楚 。
“目前 , 对于新冠病毒 , 我们认为我们的模型可以迅速标记出与以前看到的病毒序列有本质区别的新序列 , 以便在实验室进行进一步测试 。 ” Berger告诉《中国科学报》 , “你可以想象 , 模型能检查每一个新序列 , 而改变超过一定阈值的序列就需要在实验室中进行进一步研究 。 ”
初步证据表明 , 这种病毒的变异速度不像流感或HIV那么快 。 然而 , 研究人员最近发现了新加坡、南非和马来西亚出现的新突变 , 他们认为应该对潜在的病毒逃逸进行调查 。
研究人员认为 , 我们面临的问题仍然是新冠病毒的变异速度有多快 。
“该病毒种类繁多 , 控制其复制的生物机制因人而异 , 所以尽管它们有共同的特征 , 人们仍需要对每种病毒进行专门研究 , 以了解它们的突变率 。 ”Bryson说 , “我们最好的见解将来自于动物感染模型 , 其中完整的免疫反应是存在的 , 因此我们可以理解总的免疫压力是如何影响病毒突变率的 。 之后 , 我们需要对新冠病毒感染者的病毒进行测序 , 以识别感染这些人的病毒中存在的突变 。 ”
此外 , 研究人员现在正与其他人合作 , 利用他们的模型确定癌症疫苗的可能目标 , 从而刺激人体自身免疫系统摧毁肿瘤 。 他们说 , 它还可以用于设计小分子药物 , 这种药物可能不太可能引发结核病等疾病的耐药性 。
相关论文信息:https://doi.org/10.1126/science.abd7331
【病毒会“逃跑” “语言”露马脚】https://doi.org/10.1126/science.abf6894

推荐阅读