产业|百度CTO王海峰首度公开产业级知识增强大模型“文心”全景

央广网北京12月8日消息 12月8日 , 鹏城实验室与百度正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan) 。 该模型参数规模达到2600亿 , 是目前全球最大中文单体模型 。 同时 , 百度产业级知识增强大模型“文心”全景图首次亮相 。
中国工程院院士、鹏城实验室主任高文 , 百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰共同启动发布仪式 。

产业|百度CTO王海峰首度公开产业级知识增强大模型“文心”全景
文章图片

中国工程院院士、鹏城实验室主任高文(左) , 百度首席技术官王海峰联合发布鹏城-百度·文心
高文院士在致辞中表示 , “预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具 。 运用这个工具 , 可以帮助做很多人工智能的赋能 , 不局限于某个领域 , 这对人工智能的发展都是一个福音 。 ”
王海峰介绍 , 百度知识增强大模型从大规模知识和海量数据中融合学习 , 效率更高 , 效果更好 , 具有良好的可解释性 。 从2019年3月发布文心ERNIE 1.0 , 到最新的产业级知识增强大模型文心全景图 , 既包含基础通用的大模型 , 也包含面向重点领域、重点任务的大模型 , 以及丰富的工具与平台 , 有助于促进技术创新和产业发展 。
此次发布的鹏城-百度·文心是“全球首个知识增强千亿大模型” , 在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果 , 并在30余项小样本和零样本任务上刷新基准 。 鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台联手 , 解决了超大模型训练的多个公认技术难题 , 使鹏城-百度·文心训练效率大幅提升 , 模型效果更优 。 “鹏城云脑Ⅱ”是国产自主的首个E级AI算力平台 , 曾在多个国际性能测试上获得冠军 。
为解决大模型应用落地难题 , 百度团队首创大模型在线蒸馏技术 , 模型参数压缩率可达99.98% 。 压缩版模型仅保留0.02%参数规模就能与原有模型效果相当 , 为产业大规模应用打开新窗口 。
为促进产学研协“多轮驱动” , 鹏城实验室与百度成立了鹏城-百度自然语言处理联合实验室 , 并以此为依托 , 资源共享、优势互补 , 在自然语言处理前沿研究和创新应用方面协同攻关 , 助力打造国家战略科技力量 。 本次联合发布的鹏城-百度·文心将进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题 。 本着“开源开放”的理念 , 该模型代码近期会在OpenI启智社区开源 , 依托鹏城云脑Ⅱ对外开放 , 积极联合“产学研协”各方 , 充分挖掘AI大模型的赋能能力 , 助力科技创新 , 推动产业发展 。

推荐阅读