独角兽|月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能


独角兽|月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能
文章图片

2019 年全球语音交互市场规模已达到 13 亿美元 , 每一个消费者都体验着从触屏到语音的交互变革 。 GrowingIO 服务的某智能语音助手 , 根据其 2019 年财报显示:loT 平台连接设备数达到 2.35 亿 , 智能语音助手月活超过 6000 万 , 逐步成长为行业独角兽 。
用户数和交互量快速增长的背后 , 海量数据集成和处理也给该团队造成了不小的挑战 。 同时 , 如何依靠数据推动用户活跃度保持高速增长 , 也困扰着运营团队 。
该智能语音助手与 GrowingIO 在 2019 年正式合作 。 凭借 GrowingIO 提供的产品和增长方法论 , 逐步搭建起数据增长体系 。 GrowingIO 增长平台不仅高效满足了亿级数据处理需求 , 还有效降低了数据的硬件存储成本 。
基于 BitMap 存储模型 , 满足海量数据性能需求 语音作为最自然、便捷的交互方式 , 也会产生高于传统方式的海量行为数据;GrowingIO 服务的该智能语音助手 , 6000 万月活用户数会产生大量交互数据 , 海量数据会给查询和分析造成阻碍 , 同时产生高昂的硬件存储成本 。
在部署 GrowingIO 之前 , 业务团队进行基于数据分析的流程较长 。 原因是数据需求要提交研发部门 , 通过 SQL 现查的方式获得 。 随着数据量达到亿级规模 , 计算所需要的资源和时间线性增长 , 一个图表的加载可能需要数个小时 。
增加计算资源或者对查询结果进行缓存、预热已经无法满足海量数据的性能需求 。 该客户经过多方评估 , 综合考量技术水平和项目交付能力 , 选择部署 GrowingIO 增长平台 。 建立以 CDP 为核心的数据增长平台 , 满足业务端看数、取数和用数的数据增长需求 。
1. 海量数据秒级查询 , 维度无限扩充满足更多分析场景
为了满足业务团队需求 , 在公司内部推行数据增长体系 , 解决数据平台的性能问题首当其冲 。
GrowingIO CDP 采用 BitMap 的存储模型 , 并在多年项目服务经验中不断攻克技术难关 , 能够兼顾计算和存储优势 , 面对千万级 ID 数量时 , 也能得到很好的计算效果 。
通过以下性能对比图 , 可以看出随着数据量的不断递增 , SparkSQL 的计算时间线性递增 , 但是 BitMap 的计算时间却相对比较稳定 。

独角兽|月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能
文章图片

x 轴含义: 数据量/用户量
y 轴含义: 计算时间, 单位毫秒
SparkSQL 和 BitMap 性能对比
GrowingIO 增长平台的查询速度相比同类产品能够快 10 倍以上;若想达到同等性能水平 , 自研所需的时间、周期都非常可观 , 这也是众多企业选择部署 GrowingIO 增长平台的原因 。
如今 , 业务团队可以通过 GrowingIO 增长平台自助看数、取数和用数 , 无需通过数据部门 , 时效性大大提升 。 同时 , 即使对全量用户数据进行分析 , 也能保障秒级出图 。
此外 , 事件和维度的可扩展性也是一个常常被忽略的问题 。 目前同类数据产品在事件和维度的拓展上普遍只能做到 20-30 个的水平 。
【独角兽|月活千万、峰值破亿,智能语音独角兽如何大幅提升数据性能】智能语音系统作为物联网中心 , 面临越来越多的用户场景、越来越精细的用户数据维度 , 这个水平显然不能满足分析需求 。 而 GrowingIO 支持事件和维度无限扩展 , 满足不断增长的数据需求 。
2. 软硬件深度优化 , 存储成本大幅度降低
传统的分散式存储管理方式 , 不仅管理成本高 , 硬件存储成本也十分昂贵 。 GrowingIO 基于业务需求对分布式存储模型进行优化 , 自研了整个文件系统栈 。
实现不依赖本地文件系统、高可用性 , 同时承载的容量和文件数量都没有限制 。 此外 , 由于每个目录下的内容可以通过多个接入节点同时访问 , 使处理能力具备了水平扩展性 。
这样深入的源码开发和软硬件优化 , 数据的硬件储存成本将会大幅度降低 , 同时也提高了资源的分配效率 , 助力计算资源的弹性调度 。
陪伴式客户成功服务让数据增长体系融入工作流 该智能语音助手团队隶属于某大型互联网集团 , GrowingIO 增长平台项目则是由业务团队牵头、数据部门配合 , 在企业内部影响范围甚广 。 工作习惯的改变、学习成本的增加都给数据增长体系的搭建造成了一定阻力 。
GrowingIO 不仅满足工具层面的性能需求 , 更为客户提供陪伴式服务 , 短期内降低新工具在企业内部落地的摩擦 , 长期则保障数据增长体系的持续迭代和进步 。
1. 降低新工具在企业内部落地的摩擦
GrowingIO 的客户成功服务将落地服务分为 5 个阶段 , 分别是引导期、稳定期、推广期、成熟期、共创期 。 首先帮助客户培养核心使用人员 , 实现项目目标 。 后续逐步梳理企业协作流程、组织规模化培训 , 通过服务启动会、培训会等多种形式完成服务落地 。
截止目前 , 已初步实现了业务团队全员看数、用数 , 随着合作的深入 , 后面将逐步利用 GrowingIO 增长平台产出更大的业务价值 。
2. 数据增长体系持续迭代
另一方面 , 数据增长体系能否持续迭代 , 也会影响数据增长体系的建设效果 。 GrowingIO 陪伴式服务对客户使用情况进行定期“体检” , 与客户一起探讨增长平台的使用场景 , 改善内部数据平台的使用状况 。
一系列措施使数据增长体系快速融入客户的工作流 , 打造有活力、持续迭代的数据增长体系 。
结语 经过近两年的合作过程 , 业务团队逐步搭建起以数据驱动的增长体系 。 在此过程中 , GrowingIO 的产品能力和客户服务都给该智能语音助手团队留下了良好的印象 。
随着智能家居、车载语音、智能客服等语音交互场景的成熟 , 智能语音助手业务正在变得举足轻重 。 GrowingIO 也将从智能语音场景优化、用户精细化运营体系搭建等方面帮助业务团队提升用户激活、活跃和留存表现 , 实现业务价值的突破 。
关于 GrowingIO 客户数据平台(CDP)
GrowingIO 客户数据平台(CDP)通过整合跨平台、多类型数据 , 帮助企业构建以用户为视角的数据池 , 搭建用户标签和画像系统 , 提供从数据采集、整合、分析到自动化运营的一站式用户运营闭环 , 推动产业向“深度结合用户行为” 的方向发展 , 从而提供更加智能化、自动化的数据监测服务 , 发掘业务增长点 , 快速落地企业数据化转型 。

    推荐阅读