药物|施一公:AlphaFold蛋白结构预测是本世纪最重要的科学突破之一

“依我之见 , 这是人工智能对科学领域最大的一次贡献 , 也是人类在 21 世纪取得的最重要的科学突破之一 , ” 谈及 AlphaFold 的最新成果 , 生物物理学家、西湖大学校长施一公告诉 DeepTech 。

药物|施一公:AlphaFold蛋白结构预测是本世纪最重要的科学突破之一
文章图片
图 | 施一公(资料图)
7 月 23 日 , DeepTech 独家专访了施一公 , 以下为对话实录:
问:继上周在 Nature 发表论文之后 , 7 月 22 日 , DeepMind 团队在 Nature 发表论文 , 描述了 AlphaFold 对人类蛋白质组的准确结构预测 , 其得到的数据集涵盖了人类蛋白质组近 60% 氨基酸的结构位置预测 , 且预测结果具有可信度 。 这会带来哪些影响和好处?
施一公:人类蛋白质组里能够被预测的以单个蛋白为单位的空间三维结构 , 已经基本都被 AlphaFold 预测了 。 总体而言 , 预测结果可信、也比较准确 。 这是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就 。
第一个影响 , 当然是对结构生物学领域 , 这是该领域的一个颠覆性突破 。 此前人类尚未被解析的一些结构 , 现在基本上都已经被 AlphaFold 预测 , 由于置信度比较高 , 因此可以说 AlphaFold 预测出来的结果很可能就是事实 , 从已有数据来看它的预测相当的精准 。 甚至可以说 , 人类蛋白质组的结构数据突然陡增两至三倍!
第二个影响 , 是对生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理等一大批生命学科和研究领域的影响 , 这会大大改进我们对于生命过程的理解 。 比如 , 遗传学家也许积累了大量数据 , 但如果不知道蛋白质结构 , 就没法研究某个突变对于蛋白功能的影响 。 现在不同了 , 通过 AlphaFold 的结构预测就能查看人类遗传病中的每一个突变在相关蛋白结构里的具体位置 , 找到突变位置后就有可能推测出蛋白功能如何受到影响 。 也就是说 , AlphaFold 的出现 , 会从根本上帮助一大批基础研究和应用研究的实验室、一大批科研型医生、一大批科研人员更好地理解生命的分子过程 , 理解疾病发生和发展的机理 。
再比如 , DeepMind 预测出来的蛋白结构 , 包括了众多 GPCR 和关键酶在内的一大批结构未知的药物靶点蛋白 , 而且预测的结构足够准确 。 这对于制药界来说实在太重要了 , 等于提供了可靠的药物设计和药物优化的一个重要基础 。 甚至可以夸张地讲 , 所有药物小分子结合的药物靶点蛋白的结构 , 几乎被 AlphaFold 一网打尽 。
我认为 DeepMind 一定会乘胜追击 , 一是把更大更复杂的一些结构预测出来 , 二是把一些复合物的结构预测出来 , 三是如何根据预测出来的靶点蛋白结构设计药物分子 。
第三个影响可能会超越生命科学的界限 。 AlphaFold 的预测结构如果广泛应用在生命学科各分支、创新制药 , 可能会给社会和老百姓带来很大好处 , 甚至会对人类文明产生一些影响 。
问:DeepMind 创始人兼首席执行官德米斯?哈萨比斯(Demis Hassabis)说:“我们使用 AlphaFold 生成了人类蛋白质组最完整、最准确的图片 。 我们相信这是迄今为止人工智能对推进科学知识所做的最重要贡献 , 也是人工智能可以为社会带来的各种好处的一个很好的例证 。 ” 如何看待这一说法?
施一公:我认同这个说法 , 我认为这个判断没有言过其实 , 这的确是迄今为止人工智能对科学界做出的最重要的贡献 。 这也是 21 世纪截止目前人类在科学技术领域上的最大突破之一 , 也应该是人类有史以来在科学和技术领域最重要的突破之一 。 过去半个多世纪 , 人类一共解析了五万多个人源蛋白质的结构 , 人类蛋白质组里大约 17% 的氨基酸已有结构信息;而 AlphaFold 的预测结构将这一数字从 17% 大幅提高到 58%;因为无固定结构的氨基酸比例很大 , 58% 的结构预测已经接近极限了 。 这是一个典型的量变引起巨大的质变 , 而这一量变是在过去短短一年之内发生的 , 这是不可思议的革命 。 它带来的在生命科学各分支领域的革命 , 将在今后几年到十几年中逐渐显现出来 。 在我看来 , 这项突破堪比人类基因组完成测序 , 甚至更重要!
问:在促进新药靶点和候选药物的开发上 , AlphaFold 会起到怎样的作用?
施一公:对于这个问题 , 我前面已经做了回答 。 如果生物学家发现了一个未知结构的药物靶点蛋白 ,AlphaFold 的结构预测可以帮助生物学家发现该蛋白可能的药物分子结合位点 , 也就是说可以看到蛋白里面哪些部位会成为药物分子进攻的地方 。
问:AlphaFold 希望未来能给所有具有已知序列的蛋白提供预测结构 。 您认为是否有实现的可能性?以及假如实现了 , 又会带来怎样的效果?
施一公:完全有可能 , 我认为它在人类蛋白质组已经基本做到了 , 现在 AlphaFold 已经完成了人类蛋白质组 98.5% 的蛋白质结构预测 。 而这里 “给所有具有已知序列的蛋白提供预测结构” , 应该指的是其它物种 , 比如线虫、果蝇、小鼠、植物等等的蛋白质组提供精准的结构预测 , 将来一定会实现 。 这会给方方面面带来太多的意外惊喜和突破 , 也会大大促进基础生命科学研究 , 促进农业、畜牧业、甚至制造业的发展 。
问:冷冻电镜是很贵的设备 , 您和团队在冷冻电镜方面颇有建树 , 现在有了 AlphaFold 的成果 , 在西湖大学未来研究蛋白质方面 , 有什么关于 AlphaFold 的使用计划吗?
施一公:AlphaFold 的结构预测几乎对每一位生物学家或多或少都有帮助 , 尤其是结构生物学家和生物物理学家 。 我想 , 每一位用心的结构生物学家都应该知道怎么用好 AlphaFold 的结构预测 。
问:据了解 , AlphaGo 算法至今仍有人在研究和学习 。 获悉西湖大学也有工学院和深度学习实验室 , 未来计划让相关专家做一些关于 AlphaFold 的算法研究吗?
施一公:西湖大学的工学院和生命科学院其实已经开始行动 , 布局 AI 进入生命科学各领域 。 我们也会研究如何进一步改进算法 。
问:西湖大学整个学校、或者西湖大学结构生物学方面的一些新动向?
施一公:西湖大学 31 岁的博士生导师吴建平和团队成员在两周前的 Nature 上发表了一篇很重要的论文 , 解析了精子中最重要的一个离子通道蛋白复合物的结构 , 发现了几个新蛋白组分 , 这一突破是对生殖医学领域研究的重要贡献 , 很可能会被写进生殖医学领域的教科书 。 特别值得一提的是 , 吴建平在该研究突破中创造性地运用了基因编辑技术 。
问:在深度学习结合生物研究方面 , 谷歌一直走在世界前列 , 那么谷歌有哪些值得学习的地方?
【药物|施一公:AlphaFold蛋白结构预测是本世纪最重要的科学突破之一】施一公:应该说 , 从 AlphaGo 到 AlphaZero 再到 AlphaFold , 谷歌的科学技术突破不仅促进了科学的发展 , 也推动了人类的进步 。 这家高科技企业拥有十足的创新动力 , 拥有一批优秀的科学家在人类知识前沿积极探索 , 令人感佩 。 我们中国的高科技企业正在全力追赶 , 期待在不久的将来也能给世界带来惊喜!

    推荐阅读