通信技术|中国团队首次将人类全基因组分析缩短至分钟级 此前需要24小时

7分钟,这是来自中国的一支团队“合力出成绩”、一举打破的世界纪录:全球首次将人类全基因组分析,推进分钟级时代 。这支团队,由三家来自中国的机构共同组建 。他们这次所做的具体任务,叫做30X人类全基因组测序(WGS)胚系变异分析 。
(其中,“30X”是指全基因组测序的深度)
而在这个团队之前,同等条件下完成这项任务所需的时间,却长达近24小时之久 。
所以咱就是说,现在的“battle”结果就是——24小时 vs 7分钟,性能整个提升了200多倍!
通信技术|中国团队首次将人类全基因组分析缩短至分钟级 此前需要24小时
文章图片

与此同时,在相同条件下的计算成本还降低了80%,存储成本也下降30% 。
但更重要的一点是,这事可能和你我都息息相关 。
因为基因预测的一个用途,就是检测罹患多种疾病的可能性,锁定个人病变基因,以此来提前预防和治疗 。
(P.s.世界著名演员安吉丽娜朱莉就这么做过 。)
听起来确实是个好事,但如果放到过去,由于既耗时又费钱,能做得起基因预测的人屈指可数 。
但今时不如往日,随着算力、AI、大数据技术的不断发展和融合,让基因测序这样数据密集型应用变得越发亲民 。
而这一次的“7分钟”,可以说是把基因测序这件事往“平民时代”更推近了一步 。
通信技术|中国团队首次将人类全基因组分析缩短至分钟级 此前需要24小时
文章图片

△图源:美国国家卫生研究院(NIH)
那么接下来的问题便是,为什么这支队伍的方法,就能做到“快好省”呢?
从24小时到7分钟,他们是怎么办到的?
人类全基因组测序要做的事,就是对未知基因组序列的物种进行个体的基因组测序 。
但非常明显的一个难题,就是其数量过于庞大 。
毕竟对象可是组成人体2.5万基因的约30亿碱基对,换算成容量大小则约为3GB 。
通信技术|中国团队首次将人类全基因组分析缩短至分钟级 此前需要24小时
文章图片

但这还不算完,为了保障基因数据的完整性,在此基础上还需要做30次的平行测试 。
如此一来,在最终测序完成之后,全基因组的数据量便将达到约100G 。
而且随着技术的不断迭代演进,数据的存储已经从最初的人类基因组开始细分扩展,逐步涉及到肿瘤、遗传病的检测等等 。
也正是因为数据量和数据种类的日益庞大,使得这方面的工作数据存储,动辄便以PB为单位来保存 。
这就直接影响到了诸如基因采样、样本制作、数据下机、生信分析以及后基因测序等环节 。

推荐阅读