识别|出门问问发布全球首个面向产业界的语音开源工具WeNet
近日 , 2021全球数字经济大会在北京举行 。 大会以“创新引领 数据驱动——建设全球数字经济标杆城市”为主题 , 由北京市人民政府、国家发展和改革委员会、工业和信息化部、商务部、国家互联网信息办公室共同主办 。 出门问问作为中国领先的人工智能公司受邀出席 , 创始人兼CEO李志飞在人工智能产业治理主题论坛中发表《语音开源与人工智能产业稳健发展》的主题演讲 , 与业界共话科技企业的社会担当与责任 。
文章图片
全球首个面向产业界的语音开源工具 WeNet
随着语音识别在过去几年的迅速发展 , 一方面语音识别的准确率大幅提升 , 另一方面语音识别已广泛应用至智能可穿戴、智能音箱、智能车载等诸多产业 , 整个产业界对开源框架的依赖性较高 , 而与此同时 , 语音识别的主流开源框架却长年为国外所垄断开发 , 且偏学术界 , 比如90年代的GMM和近年来的DNN和HMM以及E2E、NN等 。
出门问问 WeNet 的问世 , 即为全球首个面向产品和工业界的端到端语音识别框架 , 在正式发布后短短6个月的时间里 , 于世界最大的代码托管平台 Github 上获得超过1000个 star , 成为当前最流行的产品级端到端语音识别框架 。 相较于目前主流语音识别开源工具 , WeNet 在研发之初就确立了“生产力第一” (Production First and Production Ready) 的设计原则 , 以解决语音识别在实际产品和应用中的实际问题为出发点和落脚点 , 同时兼顾简洁性、易用性 。 目前 , 也正是因为这些基本的设计准则 , WeNet 非常易于产品化 , 在工业界和高校有广泛的应用 。
文章图片
WeNet 使用当前全世界最前沿的深度学习模型结构U2++ 。 先用CTC进行流式解码 , 然后用Attention Decoder去重打分 , 提高识别准确率 。 WeNet 的出现解决了目前主流语音开源工具之痛点 , 且各项性能指标达到业界最优 , 成为世界级技术领先的开源工具 。 如果用简单的几个词总结 WeNet 的特性 , 那就是“更快、更高、更强、更有生产力” 。 目前 , WeNet 1.0 以其“小而精”的鲜明特色 , 已构建了一个完整完善的语音识别所需的方方面面的能力 , 且具有工业界应用的典型案例 。
文章图片
语音开源促进人工智能产业稳健发展
“当前 , 工业界对语音AI的需求越来越清晰 , 主要体现在自主可控、灵活定制、数据安全等三个方面 。 创建自主可控的语音开源工具势在必行 。 ”李志飞表示 , 出门问问 WeNet 通过打造社区支撑、提供行业解决方案、落地私有部署等方面 , 为AI行业创建共享机制、构建良好生态 , 进而助力AI产业的稳健发展 。
基于共促人工智能稳健发展的初衷 , 也让 WeNet 的开源社区发展非常迅速 。 在满足工业界需求的同时 , WeNet 得到了用户的广泛认可——被誉为“产品化集成度最好的框架” 。 据不完全统计 , 目前已有数百家公司采用 WeNet 进行语音识别产品研发 , 或借助 WeNet 设计思想来构建自己的语音识别系统 。 这其中包括几十家互联网和其他垂直行业的知名头部公司 , 其应用范围涵盖了智能车载、智能家居、智能客服、音频内容生产、直播、会议等大量语音识别应用场景 。
文章图片
同时 , 出门问问也为企业使用 WeNet 部署语音识别提供商业化和技术支持 。 企业皆可基于自己的数据和服务体系 , 拥有私有化系统 。 正是由于产业界的迅速发展 , 使语音识别在算法层面越来越通用和端到端 , 使其系统复杂度和使用门槛大幅度降低 , 在这种情况下AI系统开源或是一个大趋势 。
文章图片
“语音识别只是数字经济和AI产业中的一个细分领域 , WeNet 是开源星河中的一颗新星 , 我们希望通过 WeNet 能够结合很多开源力量和社区力量 , 把系统模型和私有部署做到最极致 , 中国科技创新和AI产业发展需要更多这样的星星之火 , 让AI开源成燎原之势、为国为民 。 ”李志飞呼吁以开源生态促进人工智能产业稳健发展 。
联合发布人工智能担当宣言 构建负责任的AI
在本次大会的人工智能产业治理主题论坛中 , 出门问问等数十家研究机构与创新企业联合北京智源人工智能研究院发布国内首个《人工智能产业担当宣言》 。 宣言强调科技企业在推动人工智能自律自治稳健发展中积极承担社会责任 。
人工智能的发展是为了人类 。 宣言首先强调 , 人工智能系统的设计、研发、实施和推广应符合可持续发展理念 , 以促进社会安全和福祉为目标 , 以尊重人类尊严和权益为前提 。 其次在技术能力方面 , 宣言提出要最大限度确保人工智能系统安全可信 , 提高鲁棒性及抗干扰性 , 要增强算法透明性和可解释性 , 同时保障各方权利和隐私 , 对用户数据提供充分的安全保障 。
作为中国领先的人工智能公司 , 出门问问倡导积极探索和构建开源开放协作的共享机制 , 创建自主可控的语音开源工具 , 在技术创新的基础上构建企业间深度合作的伙伴关系 , 共同确保人工智能产业的健康发展 。
文章图片
【识别|出门问问发布全球首个面向产业界的语音开源工具WeNet】出门问问创始人兼CEO李志飞表示 , 让人工智能更好地服务于人类是行业共同的目标 , 科技从业者更应感受到科技治理的紧迫性和使命感 , 拥抱开放共享 , 共举科技担当 。
推荐阅读
- 识别|沈阳地铁重大变化!能摘口罩吗?
- 识别|天津滨海机场RFID行李全流程跟踪系统完成建设 行李标签识别成功率可提升至99%
- 能力|有了长续航的独立通信手表,就不必为出门没带手机而焦虑了
- 识别率|一群年轻人教“AI”学手语,目标是让千万聋人被“听见”
- 信息|财报识别系统教你怎样做好金融信贷审批工作!
- 数据|车牌识别相机在无人值守称重行业的应用
- 识别|“刷手支付”来了?腾讯掌纹支付设备专利获授权
- 犯罪学|人脸识别有易破解隐患 准确定罪存在一定争议
- 硬件|奥睿科推出TB3-S2雷电扩展坞与生物指纹识别移动硬盘新品
- Apple|传下代 iPhone 将搭载指纹识别