AI预测结果和实验室水平相当
1994年 , 美国科学家约翰·莫尔特(JohnMoult)发起国际蛋白质结构预测竞赛 , 每两年举办一届 , 竞赛的举办正是为了吸引计算机科学、生物物理学等不同领域的专家参与到蛋白质三维结构预测这一极具挑战性的生物信息学问题中来 。 2018年 , 人工智能正式参与蛋白质三维结构的预测 , AlphaFold首次大显身手 , 在98名参赛队伍中排名第一 。 两年后 , AlphaFold2带来真正的突破 , 它用机器学习方法对几乎所有的蛋白质都预测出了正确的结构 , 其中有大约2/3的蛋白质预测精度达到了结构生物学实验的测量精度 。
事实上 , 过去半个多世纪 , 人类一共解析了5万多个人源蛋白质的结构 , 人类蛋白质组里大约17%的氨基酸已有结构信息 , 而AlphaFold2预测的结构将这一数字从17%提高到58% , 因为无固定结构的氨基酸比例很大 , 58%的结构预测已经接近极限了 。 它带来的在生命科学各分支领域的革命 , 将在今后几年到十几年中逐渐显现出来 。
施一公在接受媒体采访时曾谈到 , 人类蛋白质组里能够被预测的以单个蛋白为单位的空间三维结构 , 已经基本都被AlphaFold2预测了 。 总体而言 , 预测结果可信、也比较准确 。 对结构生物学来说 , 这是一个颠覆性突破 。 此前人类尚未被解析的一些结构 , 现在基本上都已经被预测 。
对生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理等一大批生命学科和研究领域来说 , 这会大大改进人们对于生命过程的理解 。 比如 , 遗传学家也许积累了大量数据 , 但如果不知道蛋白质结构 , 就没法研究某个突变对于蛋白功能的影响 。 现在不同了 , 通过AlphaFold2的结构预测就能查看人类遗传病中的每一个突变在相关蛋白结构里的具体位置 , 进而有可能推测出蛋白功能如何受到影响 。
再比如 , DeepMind预测出来的蛋白结构 , 包括了众多G蛋白偶联受体和关键酶在内的一大批结构未知的药物靶点蛋白 , 而且预测的结构足够准确 。 这对于制药界来说太重要了 , 等于提供了可靠的药物设计和药物优化的重要基础 。
单个蛋白质结构预测只是起点
今年7月 , DeepMind公开了AlphaFold2的源代码 , 并在《自然》上发表论文阐述了AlphaFold2的技术细节 。
“这次开源在生物学界掀起了巨大的波澜 , 意味着生物学家终于摆脱了先进设备的掣肘——此前这些昂贵的先进设备只有经费充足的大学或研究机构才有条件配置 , 而此后 , 小型团队或者个人研究者也有了参与蛋白质研究的可能 。 ”天壤创始人、上海交通大学计算机系原副教授薛贵荣说 。
苗洪江认为 , 目前的单个蛋白质结构预测只是一个起点 , 更加精准的侧链优化、蛋白质的动态分析、蛋白质与其配体(如小分子、DNA、RNA、多肽、蛋白质等)的相互作用等一系列的问题还没有解决 , 接下来的工作重点将是利用目前的全蛋白质组协同进化分析 , 建立起蛋白质与蛋白质之间相互作用的精准链路 。
推荐阅读
- 赛道|声网发布实时互动场景创新生态报告,预测RTE行业市场规模将达千亿
- the|美疾控中心预测:未来一个月内全美或有超4.4万人死于新冠肺炎
- 数字货币|是继续欣欣向荣还是泡沫破灭? 专家给出加密货币2022年五大预测
- the|美国CDC将omicron占比从73%下修 但仍预测病例会继续增加
- 量子|美国《信号》杂志预测2022年十大技术趋势
- 人工智能|人工智能预测蛋白质结构
- 细胞|厦门大学细胞生物学教师团队:为人类健康事业奋斗不息
- 红色星球|外媒预测:40年后,人类太空之旅能走多远
- 预警|200亿美元的智能手表市场又起烽烟:号称能预测心梗、中风,健康预警手表真能救命?
- Tesla|瑞信预测Q4特斯拉交付量同比涨超60% 产量成唯一限制因素