近日 , 以“技术驱动 , 释放数据要素价值”为主题的百度智能云TechDay暨百度技术开放日——数据众包专场在北京举行 。 百度技术委员会理事长陈尚义表示:“2010年初 , 百度开始布局人工智能 , 是国内投入最早、技术最强、布局最完整的人工智能领军企业 , 也是最懂数据的企业 。 目前百度智能云数据众包已经成为业界规模最大、品牌和技术最强的AI数据服务商 , 可以为广大的AI开发者提供最专业、高质量的一站式数据采集标注等服务 。 ”
文章图片
据介绍 , 百度智能云数据众包打造的AI数据标注平台 , 实现数据从采集、接入、清洗、标注 , 到质量管理、交付等各流程的一站式管理 。
【驱动力|以技术为驱动力,百度智能云数据众包专注做好“AI赋能者”】在数据采集方面 , 百度智能云采集资源覆盖40多个国家地区 , 全国8大方言区 。 百度智能云数据众包已实现到业内最快的人像采集速度 , 每周可采集人像3万个 , 采集语音5万条 。
数据标注方面 , 百度智能云数据众包已经形成四大关键能力:支持全场景的数据标注工具、全流程的流程平台管理能力、智能的标注技术以及庞大的资源支撑的能力 , 能够针对各类AI应用场景数据需求 , 提供一站式AI数据服务 。 百度智能云数据众包沉淀了70余种数据标注的能力 , 近十年来已经为百度200多条产品线和业内上百家行业头部客户提供了近5万次AI数据服务 , 正确率最高达到99.99% 。
会上 , 百度智能云数据众包团队揭秘了AI数据标注平台的核心技术 。 数据标注平台由工具平台、资源管理平台和任务分发管理平台组成 。 工具平台满足客户语音、图片、视频、文本、3D点云等全类型、全场景数据标注 , 支持点、线、框、区域等多种元素拖拽配置 , 每年支持数千个不同规则项目需求;资源管理平台与任务分发管理平台 , 打造从数据接入、任务分配、资源调度、质量审核、任务结算等全流程支撑体系 , 实现对百万级任务和数十万用户实时管理 。 借助机器决策 , 标注过程实现了人员和数据的自动流转 , 摆脱了人工干预 , 兼顾了效率和公平 。 针对用户历史标注行为进行深度挖掘 , 结合百度自身的用户画像能力 , 系统能自动描绘出全面、精准、多维的用户画像体系 , 为每一个数据标注项目推荐最合适的标、审人员 , 确保使用最匹配的人员为客户释放数据最大的价值 , 在保证质量的同时更兼顾了效率 。
值得一提的是 , 百度智能云数据众包不断探索前沿智能标注技术 , 从0到1 , 构建强大算法能力 。 目前 , AI算法已贯穿标注前、标注中、标注后全流程 , 广泛应用于预标注、辅助标注、质量检查、人员画像等各环节 , 累计提升标注效率超60% , 标注错误自动检出占比达70% , 极大提升标注效率与质量 。 据介绍 , AI辅助的智能标注引入后 , 实现人体骨骼点标注整体效率提升71% , OCR的辅助标签效率提升20% , 3D连续帧障碍物预识别单帧效率提升28.8% 。 此外 , 数据众包与百度研究院合作的基于深度学习的三维点云等前沿标注技术持续激发AI数据的潜能 。
值得一提的是 , 百度智能云发布了业内首个智能驾驶领域数据服务与资产管理平台 , 为智能驾驶企业用户提供一体化智能数据服务解决方案 。 数据服务与资产管理平台覆盖“数据采集、数据标注、数据管理、模型训练、模型评测”的人工智能开发全生命周期 , 帮助企业用户围绕数据打造AI Pipeline , 提升AI算法模型迭代效率 , 让数据更好的驱动模型开发 。
推荐阅读
- 技术|“2”类医械有重大进展:神经介入产品井喷、基因测序弯道超车
- 选型|数据架构选型必读:2021上半年数据库产品技术解析
- 技术|使用云原生应用和开源技术的创新攻略
- 网络化|工信部:2025年建成500个以上智能制造示范工厂
- 技术|聚光科技旗下临床质谱仪获批医疗器械注册证
- Apple|苹果高管解读AirPods 3代技术细节 暗示蓝牙带宽可能成为瓶颈
- 视点·观察|科技股连年上涨势头难以持续:或已透支未来涨幅
- 华依|中信证券:惯性导航有望成为L3及以上自动驾驶的标配产品
- MateBook|深度解析:华为MateBook X Pro 2022的七大独家创新技术
- AirPods|苹果谈论AirPods 3:最大榨取蓝牙技术,希望获得“更多带宽”