Intel|英特尔下一个时代的“CPU”10倍以上性能提升 1000倍能耗降低( 三 )


“我们还扩展了脉冲的概念,这将提升结果的精确度,还可以缩小网络的大小,以支持特定的问题 。”Mike介绍,“在功能上,我们在Loihi2上还加强了芯片的学习能力 。”
这些研究层面和功能层面的进步需要更强大的硬件支撑 。在电路层面,Loihi 2比Loihi 1快2到10倍,这取决于特定的瓶颈和你测量的特定参数 。例如,基于模拟的结果显示,在前馈神经网络中,Loihi2比Loihi快10倍 。
工作负荷层面,Loihi2的神经元的数量提升了8倍,同时将芯片的面积缩小了一半(芯片总内存大致相同),即基于核心大小为0.21 mm2的Loihi 2,最多支持 8192个神经元,对比核心尺寸为0.41 mm2的Loihi,最多支持1024个神经元 。

Intel|英特尔下一个时代的“CPU”10倍以上性能提升 1000倍能耗降低
文章图片

Mike解释,“第一代Loihi做了固定分配,芯片中的每个核心都支持1024个神经元 。但我们发现,在许多应用中,神经元的数量是一个有限的因素,芯片中的其它内存资源却没有得到充分利用 。因此,Loihi 2的架构允许资源在有限的程度上进行交换,同时不影响架构的格式和效率,从而当应用工作负载受限于神经元数量时(通常会发生),能够提供更多的资源来扩展到更多的神经元 。”
与此匹配,需要先进的半导体制造工艺 。“神经拟态计算的架构相对于其他架构需要更大的资源密度,Intel 4制程能够提供更大的晶体管密度,我们可以在同样大小的芯片上放置更大的神经网络 。”Mike还说,
“与以往的制程技术相比,Intel 4制程节点采用的极紫外光刻(EUV)技术简化了布局设计规则,使Loihi 2的快速开发成为可能 。”
采用预生产版本的Intel 4制程其实还有英特尔展示其先进制程领导力的作用 。需要指出的是,神经拟态架构是一个非常同质的架构,这对于仍处于产量优化过程中的早期工艺来说有很大优势,因为它可以容忍大量的缺陷 。
“神经拟态架构比其他架构更能够从Intel4预生产过程中受益 。”Mike表示 。
不过,要解决更多实际问题还需要用Loihi2构建系统 。为此,Loihi2的扩展能力也进行了提升,有了4倍速度的接口,还新增了两个接口,可以在3个维度上进行扩展 。

Intel|英特尔下一个时代的“CPU”10倍以上性能提升 1000倍能耗降低
文章图片

同时,Loihi2对芯片间的连接进行了压缩,让许多工作负载的扩展提供了10倍以上的带宽,在减少拥堵和该架构扩展到更大网络的能力方面,综合提高了60倍以上 。

Intel|英特尔下一个时代的“CPU”10倍以上性能提升 1000倍能耗降低
文章图片

推荐阅读