过去半个多世纪 , 人类一共解析了5万多个人源蛋白质的结构 , 人类蛋白质组里大约17%的氨基酸已有结构信息 , 而AlphaFold2预测的结构将这一数字从17%提高到58% 。 它带来的在生命科学各分支领域的革命 , 将在今后几年到十几年中逐渐显现出来 。
蛋白质结构预测是生物学的重要“圣杯” , 也是人工智能落子生命科学领域最炙手可热的研究之一 。
近日 , 我国自研深度学习蛋白质折叠预测平台TRFold传来好消息 , 其基于2020年第14届国际蛋白质结构预测竞赛(CASP14)蛋白质测试集的成绩仅次于“阿尔法折叠的迭代版”(AlphaFold2) , 排名全球第二 , 这是国内目前所有公开蛋白质结构预测模型中的最好成绩 , 我国计算生物学领域的表现跻身全球第一梯队 。
从2018年AlphaFold第一次代表人工智能“参战” , 到AlphaFold2用机器学习方法取得媲美结构生物学实验的精测精度 , 计算生物学给蛋白质预测这一世纪难题带来了颠覆性的解法 。 人工智能会给生命科学领域带来怎样的巨变?蛋白质结构预测这个生物学里悬而未决的终极难题之一 , 会被人工智能彻底解决吗?
深度学习可在计算生物学领域广泛应用
蛋白质结构预测是生命科学领域一个由来已久、令人着迷的问题 , 同时又以难度大、成本高、进展有限著称 。 但这个人们本以为需要一个世纪慢慢探索的问题近年来却取得了重大突破:2020年CASP14竞赛中 , 谷歌公司旗下的DeepMind公司研发的AlphaFold2取得了总分(GDT)92.4/100的成绩 , 也就是说 , 计算生物学几乎获得了与实验室方法精确度相当的蛋白质结构预测结果 。
这个里程碑事件令结构生物学家们感慨 , 自己用价值1000万美元的电镜努力了好几年得出的结果 , Alphafold2竟然一下就算出来了 。 “依我之见 , 这是人工智能对科学领域最大的一次贡献 , 也是人类在21世纪取得的最重要的科学突破之一 。 ”生物物理学家、西湖大学校长施一公不吝赞美 。
为什么要预测蛋白质结构?
天壤蛋白质折叠项目负责人苗洪江对科技日报采访人员解释 , “研究蛋白质结构 , 有助于了解蛋白质的作用 , 理解蛋白质如何行使其生物功能 , 认识蛋白质与非蛋白质之间的相互作用 , 对于生物学、医学和药学等都非常重要” 。
传统观测蛋白质结构的方法主要有3种 , 即核磁共振、X射线、冷冻电镜 , 但这些方法往往依赖大量试错和昂贵的设备 , 每种结构的研究都要花费数年时间 。 而人工智能应用于蛋白质结构预测的最新成果 , 即AlphaFold2 , 能在几天甚至几分钟预测出以前要花费数十年才能得到的具有高置信度的蛋白质结构 。
“刚开始大家还在开玩笑 , 说Deepmind是不是通过什么方法盗取了真实实验结果 , 直到大家看到文章和开源代码才敢相信这件事情真的发生了 。 ”苗洪江笑言 , 这侧面证明AlphaFold2预测结果之震撼 , “这开启了人工智能在计算生物学广泛应用的大门 , 让整个领域的人看到了深度学习在这个领域可以广泛应用 , 这实打实的双盲实验结果就是证明 。 ”
推荐阅读
- 赛道|声网发布实时互动场景创新生态报告,预测RTE行业市场规模将达千亿
- the|美疾控中心预测:未来一个月内全美或有超4.4万人死于新冠肺炎
- 数字货币|是继续欣欣向荣还是泡沫破灭? 专家给出加密货币2022年五大预测
- the|美国CDC将omicron占比从73%下修 但仍预测病例会继续增加
- 量子|美国《信号》杂志预测2022年十大技术趋势
- 人工智能|人工智能预测蛋白质结构
- 细胞|厦门大学细胞生物学教师团队:为人类健康事业奋斗不息
- 红色星球|外媒预测:40年后,人类太空之旅能走多远
- 预警|200亿美元的智能手表市场又起烽烟:号称能预测心梗、中风,健康预警手表真能救命?
- Tesla|瑞信预测Q4特斯拉交付量同比涨超60% 产量成唯一限制因素