算法|AI算法或使我们跟上新冠病毒的变异速度

机器之心转载
来源:ScienceAI
近日 , 麻省理工学院的研究者在论文中描述了一种可以预测哪些变异毒株对世界上刚研制出的疫苗构成威胁最大的机器学习算法 。

算法|AI算法或使我们跟上新冠病毒的变异速度
文章图片

随着新型冠状病毒的新变种像野火一样在全球范围内不断涌现 , 研究人员一直在夜以继日地进行试验以确定哪些新毒株可能击败我们的疫苗 。
令人欣慰的是 , 人工智能(AI)可能会对这项工作有所帮助 。 在周五Science(《科学》)杂志上发表的一篇论文中 , 麻省理工学院的研究人员描述了一种机器学习算法 , 该算法可以预测哪些变异毒株对世界上刚研制出的疫苗构成的威胁最大 。
该工具可用于快速缩小最有可能逃逸已接种疫苗或先前感染者的免疫系统的变异毒株 , 使得研究人员可以在实验室中对这些可疑变异株进行检测 , 并相应地更新疫苗 。
论文的合著者、麻省理工学院的生物工程师Bryan Bryson说:「这是疫苗研发的实时伙伴 , 现在 , 我们使用模型能做的比在实验室中做要快得多 。 」
该工具在COVID-19大流行的关键时刻到来了 。 针对SARS-CoV-2(引起COVID-19的冠状病毒)研制的数百万剂疫苗终于向公众推出 , 超过百分之三的美国人已经接种了疫苗 。
这些疫苗被设计用来训练我们的免疫系统识别冠状病毒的特殊毒株 。 但是 , 病毒变异的越多 , 那些已经接种疫苗的人和以前被感染的人对新毒株的免疫力降低的可能性就越大 , 也就是所谓的「病毒逃逸」 。 能够逃逸的冠状病毒变异株将使疫苗制造商争先恐后地在这样一个高风险的追赶游戏中不断地更新其疫苗 。
最近几周 , 来自英国、南非、加利福尼亚和其他地区的新病毒变种开始在全球范围内传播 。 这些难以应付的变种似乎比原来的病毒更具感染力 , 尽管让人高兴的是其致命性有所下降 。 多位专家公开表示 , 目前的疫苗仍能对抗这些新毒株 。
「当然 , 会有更多的突变 。 」Bryson和他的同事声称他们的算法可以帮助疫苗生产商跟上这场竞赛 , 「这将减少目前用于监测此类突变实验所耗费的大量人力物力 。 」
论文的合著者、麻省理工学院的计算机科学家Bonnie Berger说:「这是一个告诉你何时展开调查的工具 。 随着新毒株的出现 , 我们可以标记出哪些毒株有逃逸的可能性值得去研究 。 」
许多基于AI的工具对COVID-19疫苗的早期研发都有所帮助 , 例如 , 人工智能帮助研究人员确定了病毒遗传密码的哪些部分最有可能发生突变以及某些突变是如何影响其物理结构的 。 麻省理工学院的新的机器学习算法通过将AI应用于病毒逃逸而延展了AI的功能 。
该小组的模型最初是为机器语言理解而开发的 , 旨在同时查找语法和语义 。 将逃逸突变识别为保留病毒感染性但导致病毒看起来与免疫系统不同的突变 , 类似于保留句子语法但改变其含义的单词更改 。 利用两者之间的相似性 , 研究人员对其进行了创造性地修改 , 以感知病毒遗传密码的变化 。

算法|AI算法或使我们跟上新冠病毒的变异速度
文章图片

他们称这一过程为受限语义更改搜索(constrained semantic change search, CSCS) 。 当模型了解冠状病毒基因组时 , 它同时也开始了解该基因组可能发生何种变化 。 然后 , 它会生成一个可疑毒株的简短列表以在实验室中进行测试 。
为了测试毒株 , 研究人员首先将产生一种假病毒 , 该假病毒携带由计算模型识别的可疑变异 。 然后 , 他们让假病毒经受从先前接种或感染过COVID-19的人群中收集的抗体 。 如果抗体不能中和病毒 , 则表明该新病毒株能够逃避免疫系统 , 因此需要更新的疫苗 。 然后再回到算法中 , 寻找更多可疑的变异毒株 。
计算机和湿性实验室之间「就像形成了一个循环」 , Bryson说 ,「你只是在来回穿梭并试图及时了解这种流行病 。 」
研究人员在SARS-CoV-2刺突蛋白的近1000个遗传序列上加上了其他类型冠状病毒(例如引起普通感冒的冠状病毒)的另外3000个刺突蛋白序列 , 然后对其进行了模型训练 。 病毒通过刺突进入人体细胞 , 我们的免疫系统也是通过刺突识别病毒 。
数以千计的示例让该模型了解了在冠状病毒中如何控制氨基酸的排序规则 。 Berger小组的博士生、论文的合著者Brian Hie说:「语言模型的好处是 , 它们可以直接从大量的培训集中学习规则 。 这就是为什么我们要在生物环境中使用这种模型的原因 , 因为我们不知道哪些氨基酸可以并存的规则 。 」
麻省理工学院的研究人员将一些新的变体输入他们的算法进行试验 , 发现英国和南非的毒株在逃逸可能性上均得分「很高」 。 然而 , Berger说它们的得分不及实验室中创造出的逃逸突变体那么高 。
「预测高分何时可以转化为实际从人类免疫系统逃逸的能力超出了模型的能力 , 」Hie说 。 从长远来看 , 他希望继续使用该模型 , 以便预测尚未发生的病毒突变 。 「这是该研究领域的一个大胆创新的目标:针对未来的病毒接种疫苗 。 」
论文地址:https://science.sciencemag.org/content/371/6526/284
https://spectrum.ieee.org/the-human-os/biomedical/devices/ai-predicts-most-potent-covid-19-mutations
Emily Waltz
AAAI 2021线上分享 | BERT模型蒸馏技术 , 阿里云有新方法
在阿里巴巴等机构合作、被AAAI 2021接收的论文《Learning to Augment for Data-Scarce Domain BERT Knowledge Distillation 》中 , 研究者们提出了一种跨域自动数据增强方法来为数据稀缺领域进行扩充 , 并在多个不同的任务上显著优于最新的基准 。
1月27日20:00 , 论文共同一作、阿里云高级算法专家邱明辉为大家详细解读此研究 。
添加机器之心小助手(syncedai5) , 备注「AAAI」 , 进群一起看直播 。
? THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
_原题《AI算法或使我们跟上新冠病毒的变异速度》
【算法|AI算法或使我们跟上新冠病毒的变异速度】阅读原文

    推荐阅读