12月12日 , 由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT+ 2021深度学习开发者峰会在上海召开 。 此次峰会 , 最让开发者惊艳的是飞桨开源框架v2.2的重磅发布 。 百度深度学习技术平台部高级总监马艳军与百度AI产品研发部总监忻舟 , 就飞桨新版本特性与落地部署应用做了详尽解读 , 框架核心技术持续领先 , 落地部署降低应用门槛 , 飞桨正在为解决AI落地产业提供全新的答案 。
践行融合创新 , 飞桨核心技术持续积累与突破
峰会现场 , 马艳军表示 , 飞桨作为中国首个自主研发、功能丰富、开源开放的产业级深度学习平台 , 核心技术持续积累与突破 , 全新发布的开源框架2.2版本 , 涉及深度学习开发、训练、文本任务极致优化、硬件高效适配、低门槛推理部署等多方面创新性技术 , 赋能开发者 , 为产业应用和前沿探索提供技术源动力 。
文章图片
开发方面 , 飞桨提供丰富的API , 支持开发者便捷、高效地开发深度学习模型 。 飞桨框架v2.2的API更加丰富、高效并保持良好的兼容性 , 有针对性地丰富了100多个API , 可支持更广泛模型开发 , 尤其针对科学计算的模型应用 , 增加了傅里叶变换、Jacobian/Hessian/VJP/JVP等一系列API , 支持量子计算、生命科学、计算流体力学、分子动力学等应用 , 助力前沿技术探索 。
训练方面 , 全新发布端到端自适应大规模分布式训练技术 。 针对不同的模型和硬件 , 抽象成统一的分布式计算视图和资源视图 , 并通过硬件感知切分和映射功能及端到端的代价模型 , 搜索出最优的模型切分和硬件组合策略 , 将模型参数、梯度、优化器状态按照最优策略分配到不同的计算卡上 , 达到节省存储、负载均衡、提升训练性能的目的 。
基于全新的端到端自适应大规模分布式训练技术 , 百度飞桨在鹏城云脑II集群上采用自适应优化 , 训练速度达到优化前2.1倍 。 而近期发布的全球首个知识增强千亿大模型鹏城-百度·文心 , 也是基于端到端自适应大规模分布式训练技术 。
文本任务方面 , 从文本处理、训练、解码到部署进行全面加速 。 升级对字符串张量的支持 , 为开发者提供端到端文本任务开发体验 。 在预训练模型方面 , 针对Transformer Encoder的网络结构实现了极致的性能优化 , 并通过自定义算子功能 , 融合了NVIDIA FasterTransformer的高性能算子 。 基于这些优化 , 框架针对预训练模型形成了训推一体全流程开发体验 , 让部署代码节省94% 。
硬件接入方面 , 多层次、低成本的硬件适配方案降低了框架与芯片的适配成本 。 百度自研Kernel Primitive API、NNAdapter、编译器CINN(预发布)三大优化方案 , 分别对AI算子库、图、编译器后端进行软硬件结合的深度融合优化 , 极大降低了硬件适配成本 , 赋能硬件生态圈 。
推荐阅读
- 模型|2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?
- 训练|华为运动健康 Beta 新版本测试:新增健身课程分享、血压挑战计划
- 模型|经逆向工程,Transformer「翻译」成数学框架 | 25位学者撰文
- 化纤|JXK STUDIO 虎年肥猫 1/6仿真动物模型手办可爱摆件
- 模型|达摩院2022十大科技趋势发布:人工智能将催生科研新范式
- 模型|李彦宏:中国迎来AI黄金十年,集度汽车机器人明年亮相,智能交通10年内解决拥堵
- 模型|神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
- 模型|英伟达:美团机器学习平台使用NVIDIA T4 GPU
- 训练|腾讯云副总裁吴运生:AI落地出现新变化,对细分行业需要深入理解
- 错误|有了这个工具,不执行代码就可以找PyTorch模型错误