通信技术|中国团队首次将人类全基因组分析缩短至分钟级 此前需要24小时
7分钟,这是来自中国的一支团队“合力出成绩”、一举打破的世界纪录:全球首次将人类全基因组分析,推进分钟级时代 。这支团队,由三家来自中国的机构共同组建 。他们这次所做的具体任务,叫做30X人类全基因组测序(WGS)胚系变异分析 。
(其中,“30X”是指全基因组测序的深度)
而在这个团队之前,同等条件下完成这项任务所需的时间,却长达近24小时之久 。
所以咱就是说,现在的“battle”结果就是——24小时 vs 7分钟,性能整个提升了200多倍!
文章图片
与此同时,在相同条件下的计算成本还降低了80%,存储成本也下降30% 。
但更重要的一点是,这事可能和你我都息息相关 。
因为基因预测的一个用途,就是检测罹患多种疾病的可能性,锁定个人病变基因,以此来提前预防和治疗 。
(P.s.世界著名演员安吉丽娜朱莉就这么做过 。)
听起来确实是个好事,但如果放到过去,由于既耗时又费钱,能做得起基因预测的人屈指可数 。
但今时不如往日,随着算力、AI、大数据技术的不断发展和融合,让基因测序这样数据密集型应用变得越发亲民 。
而这一次的“7分钟”,可以说是把基因测序这件事往“平民时代”更推近了一步 。
文章图片
△图源:美国国家卫生研究院(NIH)
那么接下来的问题便是,为什么这支队伍的方法,就能做到“快好省”呢?
从24小时到7分钟,他们是怎么办到的?
人类全基因组测序要做的事,就是对未知基因组序列的物种进行个体的基因组测序 。
但非常明显的一个难题,就是其数量过于庞大 。
毕竟对象可是组成人体2.5万基因的约30亿碱基对,换算成容量大小则约为3GB 。
文章图片
但这还不算完,为了保障基因数据的完整性,在此基础上还需要做30次的平行测试 。
如此一来,在最终测序完成之后,全基因组的数据量便将达到约100G 。
而且随着技术的不断迭代演进,数据的存储已经从最初的人类基因组开始细分扩展,逐步涉及到肿瘤、遗传病的检测等等 。
也正是因为数据量和数据种类的日益庞大,使得这方面的工作数据存储,动辄便以PB为单位来保存 。
这就直接影响到了诸如基因采样、样本制作、数据下机、生信分析以及后基因测序等环节 。
推荐阅读
- China|中国移动10086 APP发布公告:将于1月30日停止运营
- 中国新闻网|最新数据:中国有效发明专利359.7万件 有效注册商标3724万件
- 中国新闻网|美团外卖:西安受疫情影响骑手免除所有违规扣罚
- 中国新闻网|易导致浪费!当抵制!中消协批肯德基盲盒
- 反刍动物|西北工业大学王文教授带领团队再次入选“中国生命科学十大进展”
- 代码|周鸿祎:不理解35岁被职场抛弃,中国人35岁就老了?程序员年纪越大经验越丰富
- 一财网|“断网”上热搜!中国电信回应:网络设备故障
- 人物|周鸿祎不理解35岁被职场抛弃:不知道为什么 中国人好像35岁就老了
- 新浪科技综合|中国学者找到新生儿黄疸与空气污染的关系 建预测模型
- 中国基金报|砍仓4亿!“木头姐”出手,大举减持京东