技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍( 四 )


MagicMind 支持跨框架的模型解析、自动后端代码生成及优化 , 在 MLU、GPU、CPU 训练好的算法模型上 , 借助 MagicMind , 用户仅需投入极少的开发成本 , 即可将推理业务部署到寒武纪全系列产品上 , 并获得优化后具有竞争力的性能 。

技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍
文章图片

推理加速引擎 MagicMind 是寒武纪软件栈 Cambricon Neuware 全新升级的重要组成部分 。
为了加快用户端到端业务落地的速度 , 减少模型训练研发到模型部署之间的繁琐流程 , 寒武纪的统一基础软件平台 Cambricon Neuware 整合了训练和推理的全部底层软件栈 , 包括底层驱动、运行时库、算子库以及工具链等 , 将 MagicMind 和深度学习框架 Tensorflow , Pytorch 做了深度融合 , 可以实现训推一体 。
随着软件栈升级 , 开发者们在寒武纪全系列计算平台上 , 从云端到边缘端 , 用户均可以无缝地完成从模型训练到推理部署的全部流程 , 进行灵活的训练推理业务混布和潮汐式的业务切换 , 可快速响应业务变化 , 提升算力利用率 , 降低运营成本 。
【技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍】在通用性方面 , Cambricon Neuware 支持 FP32、FP16 混合精度、BF16 和自适应精度训练等多种训练方式并提供灵活高效的训练工具 , 高性能算子库已完整覆盖视觉、语音、自然语言处理和搜索推荐等典型深度学习应用 , 可满足用户对于算子覆盖率以及模型精度的需求 。
支持 8K 解码 , 加入硬件安全模块
思元 370 升级了视频图像编解码单元 , 可提供更高效的视频处理能力和更优的编码质量 , 支持更复杂、更繁重、低延时要求的计算机视觉任务 。
解码方面 , 思元 370 可支持 132 路 1080p 视频解码或 10 路 8K 视频解码 。 编码方面 , 全新编码器通过灵活的码率优化(RDO)控制、多参考帧、二次编码等特性组合 , 在相同图像质量(全高清视频 PSNR)的情况下比上一代产品节省 42% 带宽 , 有效降低带宽成本 。

技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍
文章图片

思元 370 视频编码质量显著提升
此外 , 寒武纪还在思元 370 芯片上内置了安全模块 , 切实保障用户信息安全 。 它成为了寒武纪第一颗支持国内外主流加密标准的云端芯片 , 支持用户数据、深度学习模型的加解密以及计算结果的加密输出 , 通过信任根的方式 , 保障 AI 芯片在启动及运行过程中加载的所有代码的安全性 , 还支持远程认证 , 用户可在业务运行过程中远程验证 AI 环境安全性 。

技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍

推荐阅读