阻挡HPC前行的“最后一公里”,打破“存储墙”迫在眉睫( 二 )


在最新发布的超级计算机TOP500榜单上,连续两届蝉联第一的Fugaku(富岳)超级计算机将其在新的混合精度HPC-AI基准上的性能提高到了2.0 exaflops,超过了6个月前1.4 exaflops的纪录。之所以日本方面非常强调这一指标,一定程度上反应了日本超级计算机的发展思路,即瞄准日趋丰富的AI场景化应用打造更高性能超算平台。这一技术构建趋势,很好匹配了IDC最新研究报告对于新兴HPDA和HPC-based AI场景应用的预测。
随着CPU、GPU等处理器性能的快速提升,以及多元化算力的融合发展,打造HPC的门槛和难度正在大幅降低,HPC从小众走向大众是必然趋势。HPC作为一种计算能力更强的平台,不仅作为数字经济时代和新基建的重要基础,继续在诸如科研、天文、能源、军事等方面继续发挥重要作用,同时在基因测序、气象科学、工业创新、大数据分析、智能医疗、深度学习、人脸识别等新兴领域,更广泛的服务于大众需求。
HPC前行的存储瓶颈
这是一个最好的时代,也是一个最坏的时代。
随着5G、大数据、AI等技术的快速发展,我们看到了HPC与大数据、AI的融合趋势,也坚定地认为,HPDA、HPC-based AI等新兴HPC场景将在各行各业全面开花,HPC普及化的时代已经到来。
然而,在CPU以摩尔定律为牵引快速提升性能的过程中,HPC发展却面临存储以及I/O速度与计算能力越来越不匹配所带来的“存储墙”问题。众所周知,在计算机发展过程中,CPU性能的增长是远高于存储性能和I/O性能的,这导致在计算机不断发展过程中,计算、存储、I/O 间的速度差距会越来越显著。
2014年某机构针对数据中心的性能调查显示,当年CPU性能增长52%,内存性能增长9%,I/O性能增长6%,而存储性能的提升最慢,因为这不仅与介质物理性能有关,还与存储协议有关,这种介质与协议的变化其实非常缓慢。存储性能落后于CPU、内存带宽性能,就意味着数据访问能力落后于数据的处理能力。
对高性能计算机而言,由于采用的是并行计算机体系架构,由多CPU和GPU级联打造的高性能并发算力,会如潮水一般涌入,使得“存储墙”问题更难以克服。最终导致的结果是,CPU空转等待存储器访问的时间占了很大比例,并行计算效率大幅下降。目前大规模并行计算机在实际应用中的效率只有5%左右,存储性能成为提升效率的最大制约。
随着HPDA、HPC-based AI等新兴场景应用的全面爆发,企业对于高性能、实时化的大数据分析需求将变得更加迫切。
阻挡HPC前行的“最后一公里”,打破“存储墙”迫在眉睫阻挡HPC前行的“最后一公里”,打破“存储墙”迫在眉睫
文章插图
在HPC领域,目前包括华为、英特尔都在通过统一多元化的异构算力来解决HPC产业发展中的算力需求,并取得明显的成效。为克服“存储墙”问题,包括华为在内的一批厂商也在努力,正在通过技术革新,深入研究智能存储体系结构、高性能存储技术等关键技术,减少存储与计算之间的性能差距,打通HPC前行的“最后一公里”。

推荐阅读