图神经网络加速芯片进入倒计时全球首款商用图神经网络加速IP核正式发布

【2021年01月08日北京】1月8日,在与中国科学院计算所和中国科学院计算所南方研究院的合作基础上,北京中科核心科学技术集团有限公司(简称中科核心)正式发布了图神经网络加速芯片的IP核(即制作芯片的知识产权核),向世界发布了商业许可 。据该团队介绍,目前市场上没有IP核那样的认可 。因此,该IP核是世界上第一个图神经网络加速IP核,专注于高效加速图神经网络的推断阶段 。

适合图神经网络的计算能力

该图神经网络加速IP核号为GCUZero,主要研究者之一是中国科学院计算所的特别研究助理严明玉博士,毕业于中国科学院计算所,曾在美国加利福尼亚大学圣巴拉分校SEAL实验室访问,主要从事图计算和图神经网加速结构研究 。严明玉表示,Zero意味着团队从0号认知智能芯片开始,希望实现机器和人类智能零差距的g和u图处理单元(Graphunit)的意思,代表满足图神经网络特殊计算力需求的计算单元,c表示计算单元给予机器认知智能 。

GCUZero

Homosapiens系列

基于混合结构设计思想,GCUZero分别是图神经网络的两个主要执行阶段图,经历阶段和神经网络转换阶段设计相应的加速引擎,流水两个引擎的执行 。该设计构想符合图神经网对计算能力的特殊要求,大大提高了图神经网的执行效率 。

例如,在加速图神经网络中重要的分支图卷积神经网络的执行过程中,GCUUZero可以提供低延迟独立执行模式(低延迟模式)和高并发融合执行模式(高并发模式)两种工作模式,具有四高三低四少的优点 。

四高是指高可匹配性(面向不同的应用场景配置不同的执行模式)、高可扩展性(多个IP核连接可以执行更大规模的图神经网络)、高并发(几十个图节点处理任务同时执行)、高能效(比传统处理器更有效)三低是指在低延迟模式下,所有资源都可以共同执行单个图节点的处理任务,实现低延迟、低开支、低能耗四个是指在高并发模式下,多个图节点的处理任务同时执行,两个主要阶段可以流水,减少中间数据的计算和访问,从而实现更少的访问、更少的能耗、更少的存在

【图神经网络加速芯片进入倒计时全球首款商用图神经网络加速IP核正式发布】开启图神经网络加速时代

图神经网络被认为是推动认知智能发展的有力推理方法,有望解决深度学习无法处理的关系推理、可解释性等一系列问题,使机器能够、思考 。

虽然目前国际学术界已有团队开展了基于图神经网络加速的相关研究,但行业也有基于图神经网络的着陆应用,但目前图神经网络加速芯片在国际上是无人区 。

2020年初,严明玉博士在国际计算机结构顶级会议HPCA上发布了国际首个图神经网络的加速结构设计HyGCN 。严明玉表示,GCN即图卷积神经网络(GraphConvolutionalNetwork、GCN是其缩写),作为图神经网络最重要的分支,GCN融合了深入的学习算法和图算算法,在搜索、推荐、风险控制等多个重要领域中

完整筹码进入投片倒计时

GCUZeroIP核是我们Homosapiens系列的首个IP 。严明玉博士表示,面向高性能和超高性能的图神经网络训练和推测,Homosapiens系列今年明年两年陆续发布新产品 。

Homosapiens取自生物学上的智者,由于高度发展的大脑带来的推理和语言能力,智者最终在残酷的生存竞争中成为万物之灵 。将图神经网络系列芯片命名为Homosapiens,表明研究团队将认知智能赋予机器信念和决心 。

现在,人工智能从数据驱动的感知智能阶段进入数据和知识双驱动的认知智能阶段 。在认知智能阶段,机器有望获得基于知识的逻辑推理能力 。图神经网络技术的发展和应用是关键,其效果也在行业现有的落地应用中得到了验证 。其次,希望直接用于图神经网络计算的加速器件 。

严明玉表示,GCUZeroIP核基于台积电先进的12nm工艺,运行频率可达1.2次GHz 。在Reddit数据集和GraphSage图神经网络模型下,GCUUZeroIP基于64GB/s的片外存储带宽,10毫秒以内完成的图节点处理任务数是英伟达最先进的人工智能推理GPUTESLAT4的两倍以上 。他进一步透露,在GCUZero的基础上,该研究团队设计了完整的芯片,计划投入,今年第二季度将搭载在中科核心金刚高通量计算机上 。

    推荐阅读