MagicMind 支持跨框架的模型解析、自动后端代码生成及优化 , 在 MLU、GPU、CPU 训练好的算法模型上 , 借助 MagicMind , 用户仅需投入极少的开发成本 , 即可将推理业务部署到寒武纪全系列产品上 , 并获得优化后具有竞争力的性能 。
文章图片
推理加速引擎 MagicMind 是寒武纪软件栈 Cambricon Neuware 全新升级的重要组成部分 。
为了加快用户端到端业务落地的速度 , 减少模型训练研发到模型部署之间的繁琐流程 , 寒武纪的统一基础软件平台 Cambricon Neuware 整合了训练和推理的全部底层软件栈 , 包括底层驱动、运行时库、算子库以及工具链等 , 将 MagicMind 和深度学习框架 Tensorflow , Pytorch 做了深度融合 , 可以实现训推一体 。
随着软件栈升级 , 开发者们在寒武纪全系列计算平台上 , 从云端到边缘端 , 用户均可以无缝地完成从模型训练到推理部署的全部流程 , 进行灵活的训练推理业务混布和潮汐式的业务切换 , 可快速响应业务变化 , 提升算力利用率 , 降低运营成本 。
【技术|寒武纪发布云端AI芯片思元370,chiplet技术打造,性能大幅提升2倍】在通用性方面 , Cambricon Neuware 支持 FP32、FP16 混合精度、BF16 和自适应精度训练等多种训练方式并提供灵活高效的训练工具 , 高性能算子库已完整覆盖视觉、语音、自然语言处理和搜索推荐等典型深度学习应用 , 可满足用户对于算子覆盖率以及模型精度的需求 。
支持 8K 解码 , 加入硬件安全模块
思元 370 升级了视频图像编解码单元 , 可提供更高效的视频处理能力和更优的编码质量 , 支持更复杂、更繁重、低延时要求的计算机视觉任务 。
解码方面 , 思元 370 可支持 132 路 1080p 视频解码或 10 路 8K 视频解码 。 编码方面 , 全新编码器通过灵活的码率优化(RDO)控制、多参考帧、二次编码等特性组合 , 在相同图像质量(全高清视频 PSNR)的情况下比上一代产品节省 42% 带宽 , 有效降低带宽成本 。
文章图片
思元 370 视频编码质量显著提升
此外 , 寒武纪还在思元 370 芯片上内置了安全模块 , 切实保障用户信息安全 。 它成为了寒武纪第一颗支持国内外主流加密标准的云端芯片 , 支持用户数据、深度学习模型的加解密以及计算结果的加密输出 , 通过信任根的方式 , 保障 AI 芯片在启动及运行过程中加载的所有代码的安全性 , 还支持远程认证 , 用户可在业务运行过程中远程验证 AI 环境安全性 。
推荐阅读
- 技术|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- Samsung|三星预告1月11日发布Exynos 2200芯片组 RDNA 2 GPU加持
- 手机|一加10 Pro宣传视频曝光:将于1月11日14点发布
- 选型|数据架构选型必读:2021上半年数据库产品技术解析
- 技术|使用云原生应用和开源技术的创新攻略
- 语境|B站2021个人年度报告发布:你共计看了多少个视频
- 功能|Linux 微信官方版 2.1.1 正式发布
- 技术|聚光科技旗下临床质谱仪获批医疗器械注册证
- Apple|苹果高管解读AirPods 3代技术细节 暗示蓝牙带宽可能成为瓶颈
- 硬件|闪极140W多口充电器发布:首发399元 支持PD3.1