华深智|AlphaFold2迎来劲敌,中国团队携HeliXonAI打破全球蛋白质结构预测记录

蛋白质结构预测是 AI 走进生命科学的关键成果之一 , 对生物学研究意义重大 。
近日 , 在全球持续蛋白质结构预测竞赛 CAMEO(Continous Automated Model EvaluatiOn)上 , 来自 DeepMind 的深度学习模型 AlphaFold2 被参赛新秀 HeliXonAI 打破了以往的记录 。
一石激起千层浪 , HeliXonAI 立即得到业内人士的广泛关注 。
据悉 , CAMEO 竞赛的规则是 , 每位参赛“选手”需每周对 20 个“疑难”蛋白质的结构进行预测 , 其分数和名次每周都会进行在线更新 。
因此 , 该竞赛吸引来不少世界范围内生物计算领域的前沿模型“选手” , 如来自百度的 PaFold、腾讯的 tFold 以及华盛顿大学蛋白质设计研究所的 RoseTTAFold 。

华深智|AlphaFold2迎来劲敌,中国团队携HeliXonAI打破全球蛋白质结构预测记录
文章图片
图 | CAMEO 竞赛的成绩榜(来源:CAMEO 官网)
在 CAMEO 竞赛的成绩榜上 , 位置偏右代表其预测的蛋白质结构较多 , 偏上代表其预测的蛋白质结构更准确 。 现在 , 位居右上角的正是 HeliXonAI 。
此前 , CAMEO 发布了 17 个“疑难”蛋白质 , HeliXonAI 的平均预测精确度为 84.0 ,而 AlphaFold2 的平均预测精确度在 81.9 。
而且 , 在蛋白质结构预测的另一指标 TM-score 方面 , HeliXonAI 同样凭借 91.6 的分数胜过 AlphaFold2 的 85.6 。 同 PaFold、RoseTTAFold 的分数相较 , HeliXonAI 依旧遥遥领先 。 据了解 , HeliXonAI 是由 AI 制药公司华深智药生物科技有限公司(以下简称为“华深智药”)所开发的结构预测平台。 同时 , 它也是清华大学智能产业研究院(Institute for AI Industry Research, 简称 AIR)第一项对外公开的孵化项目 。
此前 , HeliXonAI 在用于结构预测的评价测试 lDDT(Local Distance Different Test)中同样表现良好 , 连续四周拿到 83.5 的高分 , 名次居世界第一 。
蛋白质对生命机体至关重要 , 但如何理解蛋白质的三维空间结构却是生物学中的重大挑战 , 一直困扰着众多生物学家 。
2020 年 , DeepMind 推出深度学习模型 AlphaFold2 , 其对大部分蛋白质结构的预测准确度已达到冷冻电镜等复杂仪器观察预测的水平 , 在业内引起轰动 。

华深智|AlphaFold2迎来劲敌,中国团队携HeliXonAI打破全球蛋白质结构预测记录
文章图片
图 | DNA双螺旋结构(来源:Pixabay)
不过 , AlphaFold2 也存在一定的缺点 。 比如 , 在同源信号不强时 , 该模型会产生较大的预测误差;此外 , 其对抗体可变区的预测也不够准确 。
【华深智|AlphaFold2迎来劲敌,中国团队携HeliXonAI打破全球蛋白质结构预测记录】在此背景下 , 华深智药推出 AI 药物研发平台 HeliXonAI , 其涵盖蛋白质结构预测等一系列算法 , 并在 AlphaFold2 的基础上做出了诸多改进 。

推荐阅读