天书|从1%起步,中国基因测序研究跻身世界前列——“生命天书”破译20年


天书|从1%起步,中国基因测序研究跻身世界前列——“生命天书”破译20年
文章图片

脱氧核糖核酸示意图 。视觉中国供图

天书|从1%起步,中国基因测序研究跻身世界前列——“生命天书”破译20年
文章图片

2001年2月12日 , 由美、英、法、德、日和中国6国的科学家共同参与的国际人类基因组公布了人类基因组图谱及初步分析结果 。 这个被誉为生命科学“登月计划”的研究项目取得重大进展 , 为人类揭开自身奥秘奠定了坚实的基础 。
今年是“人类基因组计划”协作组发表人类基因组序列草图20周年 , 这一被誉为生命科学领域“阿波罗登月计划”的国际大科学计划 , 也有中国人的身影:拿下其中不可或缺的“1%” 。
尽管只参与了1%的任务 , 但对中国来说意味着一个重要开端 。 前不久 , 在中国科学院遗传与发育生物学研究所、中国科学院北京基因组研究所和华大基因联合举办的纪念国际人类基因组工作草图绘制和“1%项目”完成座谈会上 , 与会院士专家的一个共同观点是:不要小看了这1% , 正是从这1%起步 , 使我国成为世界上少数几个能独立完成大型基因组分析的国家 , 带动我国基因组学研究从追赶到并跑 , 跻身世界前列 。
从此 , 中国基因测序研究走向全球第一梯队 。
“1%项目”
1953年 , 英国科学家弗朗西斯·克里克和詹姆斯·沃森发现DNA的双螺旋结构——由含有四种碱基的脱氧核苷酸连接而成的长链 。 这4个“字母”排列组合构成了所有物种基因组的“天书” 。
如何破译这部天书 , 从而了解生命的奥秘?1977年 , 英国生物化学家弗雷德里克·桑格等发明了末端终止测序法 , 标志着第一代DNA测序技术的诞生 。 同年 , 他们测定了第一个基因组序列 , 全长5375个碱基的噬菌体X174 。 自此 , 人类获得了窥探生命遗传密码的能力 。
此后 , 解码DNA序列的尝试就从未停止 。
1990年10月 , “人类基因组计划”在美国首先启动 , 英、日、法、德相继参与 , 组成了国际“人类基因组计划”协作组 , 其核心内容是测定人类基因组的全部DNA序列 , 获得人类全面认识自我最重要的生物学信息 。
【天书|从1%起步,中国基因测序研究跻身世界前列——“生命天书”破译20年】这项被誉为生命科学领域“登月计划”的“盛宴” , 中国要参与吗?答案是肯定的 。
1994年 , 中国“人类基因组计划”在谈家桢、吴旻、强伯勤、陈竺 , 以及沈岩、杨焕明等科学家的倡导下启动 。
中科院院士、华大基因联合创始人杨焕明至今记得 , 1997年11月 , 在湖南张家界举行的中国遗传学组青年委员会第一次会议上 , 包括他在内的许多青年科学家商议要加入国际“人类基因组计划” , 推动中国基因组科学的发展 。
随后 , 在中国科学院和国家南、北方基因组中心同行的支持下 , 中国科学院遗传所(现遗传发育所的部分前身)人类基因组中心在1998年8月成立 。 按遗传所原所长陈受宜的话说 , 该中心将“有志于此的人才汇聚一堂” , 解决了当时我国大规模基因组研究“人才匮乏”的窘境 。
次年7月7日 , 国际“人类基因组计划”协作组公布了中国加入“人类基因组计划”的申请 , 并于同年9月1日正式向全世界宣布 , 这标志着我国成为美、英、日、法、德之外 , 第六个 “人类基因组计划”的参与国家 , 也是唯一的发展中国家 。
中科院院士、时任国家人类基因组南方研究中心执行主任赵国屏介绍 , 人类基因组包含近两万个编码蛋白质的基因 , 由约30亿个碱基对组成 , 分布在细胞核的23对染色体之中 。 中国在“人类基因组计划”中负责测定和分析3号染色体短臂上从端粒到标记D3S3610间大约30厘摩尔(相当于3千万个核苷酸)的区域 , 因此被称为“1%项目” 。
“也许‘1%项目’对整个项目而言有些微不足道 , 但它的实施给我国基因组学发展所带来的意义却是重大的 。 同时 , ‘1%项目’也对社会公众进行了一次声势浩大的基因及基因组普及教育 , 为中国生命科学研究和生物产业发展开拓了无限的空间 。 ”赵国屏说 。
“中国印记”
2001年8月26日 , 中科院遗传所人类基因组中心和国家南、北方基因组中心共同完成了“包干”区域任务——“1%项目”的基因序列图谱 , 相比国际同行 , 提前两年高质量完成任务 。
“加入国际‘人类基因组计划’ , 可以使中国平等分享该计划所建立的所有技术、资源和数据,并使我国成为世界上少数几个能独立完成大型基因组分析的国家 。 ”杨焕明说 。
2003年4月25日 , 距离发现DNA双螺旋整整半个世纪后 , 历时13年 , 耗资近30亿美元的“人类基因组计划”宣告完成 。
作为人类科学史上的伟大工程 , 这一计划带来了生命科学的新时代 , 在发展过程中建立起来的基因组学、生物信息学技术对生物相关学科和产业起到了巨大的推动作用 , 有关生命科学的新兴技术和生物产业如雨后春笋般涌现 。
杨焕明告诉采访人员 , 中国科学家“抢”到“人类基因组计划”1%的份额 , 让这个人类科技史的重要里程碑上刻下了“中国”二字 。 更重要的是 , 它还带动了中国基因测序技术从追赶实现并跑 , 并在测序仪的研制和量产以及生物信息学软件的开发等方面逐渐走向全球第一梯队 。
在他看来 , 通过参与这一计划 , 中国科学家得以在短时间内学习并追赶发达国家的先进生物技术 , 先后完成了水稻基因组、小麦A基因组、SARS冠状病毒的基因组研究 , 以及对熊猫、家猪、家鸡、家蚕等动物基因组的测序工作 , 使我国的基因组研究得以跻身世界前列 。
“高歌猛进”
人类基因组草图发布20年来 , 相关科学研究突飞猛进 。 随着基因组测序技术的不断发展 , 成本也出现了“断崖式”下跌 。
“人类基因组计划”在1985年被提出时 , 可谓是一次“世纪拍板”:当时无人知晓测序究竟要花多少钱 , 于是按1美元一对碱基做的“拍脑袋”预算 , 总预算30亿美元 。 计划周期为15年 , 即于2005年完成 。
杨焕明说 , 当第一个人类基因组被完全解读后 , 科学界的普遍共识则是迫切需要新的技术革命 。 以更低的成本、用更短的时间和更高的效率来准确地测定每个人的基因组 。 如此 , 基因组学才有未来 。
如今 , 自“人类基因组计划”以来 , DNA测序技术的发展已经历4次历史性飞跃 。
2007年5月 , “人类基因组计划”完成4年后 , “DNA之父”詹姆斯·沃森拿到了世界上首份个人基因组图谱 。 绘制沃森基因组图谱的“吉姆工程”前后只用了不到两年时间 , 花费仅200万美元 。
2008年 , 全基因组测序的成本降至20万美元 。 到2010年 , 该费用已经可以控制在1万美元以内 。 而据美国国立卫生研究院数据 , 到2020年 , 人类全基因组测序的成本已降低到1000美元以下 。
尝到“甜头”后 , 科学家的创新热情持续高涨 , 又发明了第三代单分子测序技术、第四代核苷酸测序技术 , 可进行单条序列长度更长、更准确的测序 。
赵国屏说 , 正是基于四代测序技术的“接力赛” , 人类基因组序列终于“补齐” , 有了更完整的版本 。 而此前发表的人类全基因组序列都留有不少“缺口”或“空洞” 。
前不久 , 由加州大学圣克鲁斯分校的卡伦·米加和国家人类基因组研究所的亚当·菲利皮领导的“端粒到端粒”联盟绘制的新版本基因组新版本 , 比2001年的版本增加了近两亿个碱基对以及2226个新基因 , 使人们获得了约30.55亿对碱基对的完整信息 。 这一结果填补了之前剩余的大部分缺口 , 是自人类参考基因组首次发布以来进行的最大改进 。
2018年9月30日 , 詹姆斯·沃森等人在《自然》杂志共同撰文指出:“人们常常以为 , 是先有科学发现再有技术发明 , 科学发现和技术发明存在单向关系 , 其实不然 。 ”
他们认为:很多科学发现都是由技术发明推动的 。 比如 , 由于玻璃磨制技术的改进 , 发明出了望远镜 , 天文学才得以空前进步;再如 , 莱特兄弟发明了飞机 , 其后才有空气动力学 。 有了DNA测序技术的进步和工具的发展 , 基因组科学才有如此惊人的突破性发展 。
“曙光初现”
20年来 , 这一破译“生命天书”划时代的成就 , 给人类对疾病和物种演化的认知带来了革命性变化 。 基因测序技术不断进步 , 测序成本以“超摩尔速度”直线下降 , 新的基因组药物不断问世 , 科学家们解密的致病基因越来越多 。
人类基因组研究院主任埃里克·格林从第一天起就参与了“人类基因组计划” , 他曾想象有一天基因组学可能会成为临床治疗的一部分 , “但我真的没想到这会在我有生之年发生 。 ”
2010年 , 科学家怀揣了数十年的梦想成为现实 。
那一年 , 罹患罕见致命性肠道感染病的6岁美国男孩尼古拉斯·沃尔克 , 成为世界上第一个被基因测序技术拯救的儿童 。 基因测序发现他有一个出人意料的基因突变 , 通过从脐带血中取出细胞进行骨髓移植 , 取得了良好疗效 。
赵国屏说 , 这一奇迹给了科学家巨大的信心 。 近年来 , 又有多位地中海贫血、白血病患者受益于基因技术被治愈 。 这些成果向人们展示了基因科技造福人类的前景 。
自2001年开始 , 每年关于蛋白编码基因的学术论文数量在1万篇到两万篇 , 很多研究集中在一些“超级明星基因”上 , 这对深入认识重要的基因十分关键 。
2001年之前 , 明确某种药物全部蛋白靶点的概率不到50% 。 “人类基因组计划”完成后 , 美国每年通过的药物几乎都有清楚的作用靶点说明 。
“人类基因组序列就像化学元素周期表对化学一样重要 , 可以知道世界是由多少种元素组成 。 而基因组提供了遗传信息 , 人的生、老、病、死都与基因组图谱密切相关 , 其重要性不言而喻 。 ”杨焕明说 。
他同时表示 , 相比未来 , 生命科学的组学时代才曙光初现 。 新冠肺炎疫情来袭也再次提醒人类:我们对生命的认识还远远不够 。 要真正破译生命这本天书 , 科学家还需要携手构建生命科学的“大数据”时代 。
中青报·中青网采访人员 邱晨辉 来源:中国青年报

    推荐阅读