一文了解用户数据分析常见指标与原理 用户行为数据的主要分析方法

我们要通过数据分析对业务进行诊断,找到当中的问题所在,就需要我们在使用数据分析之前,对其分析指标和原理有充足的了解,才能够应对更多复杂的问题 。作者总结了用户数据分析常见指标和原理,与你分享 。

一文了解用户数据分析常见指标与原理 用户行为数据的主要分析方法

文章插图
本着知其然知其所以然的原则,本篇给大家介绍用户数据分析常见指标以及原理 。
一、原理
1. HTTP协议
超文本传输协议(HTTP)是一种通信协议,指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则,我们平时上网访问某个网站就是在http协议支持下进行服务器端和客户端的数据交互 。但它是一种无状态的协议,一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接 。
通常情况下会有很多请求同时向服务器发送,那么服务器怎么才能知道这些请求的归属呐,所以就需要会话跟踪技术来实现这个目的,其中cookie&session就是常用的会话跟踪技术之一 。
2. 会话
定义:会话是用户在指定的时间段内在网站(APP)上发生的一系列行为,是由多次http请求完成的 。例如,一次会话可以包含多个网页的浏览或者一次社交互动或者一次电子交易 。
重要性:会话是行为数据记录的必要维度,会话的准确性直接影响对用户行为的解读以及部分关键统计指标的准确性,例如常用数据统计指标:使用频次、使用时长、平均使用时长、平均交互深度、跳出率、转化分析、用户路径等都是依据会话统计的 。
例如平均使用时长的定义是在一定统计时间内,浏览网站的一个页面或整个网站时用户所逗留的总时间与该页面或整个网站的访问次数的比 。
平均使用时长=所有用户产生的所有会话总时长/所有用户产生的会话总数
平均访问时长越久,证明 Web/APP 越有吸引力,如果用户停留的平均时间非常低,那么可能内容不够有趣,或界面优化较差导致真正有价值的内容无法吸引用户,影响用户体验 。
切割原理:
【一文了解用户数据分析常见指标与原理 用户行为数据的主要分析方法】 ①按照时间切割:web 产品建议切割时间为 30 分钟,所以王小明两次浏览页面的时间超过了 Web 端的 30 分钟,被记录为两个会话 。APP 产品建议切割时间为 1 分钟,那么就代表着如果用户在做了某个行为1 分钟后没有任何其他动作,前面的 “会话” 便会被 “切割” 并结束 。
②按照事件切割:在某些情况下,我们也可以设置特定的 “会话” 开始和结束事件,一旦用户做了某个操作就会自动开始/结束会话 。例如付款成功、或者发表内容成功 。具体的切割规则应该根据业务规则灵活设置,不同的数据分析工具有不同的 Session 切割规则 。例如诸葛的切割规则如下:
  • iOS用户:屏熄、home键切到后台、杀掉进程即判断为会话结束;
  • Android用户:当应用重新进入活跃状态与上次活跃状态相隔30秒以上时,会计为一次新的会话;
  • web、小程序:会话的开始是用户打开产品的某个页面,如果用户在30分钟内没有任何操作或关闭页面,则会话结束 。技术上,诸葛io通过cookies(小程序通过storage)追踪用户的会话 。
3. 会话跟踪
定义:会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话 。常用的会话跟踪技术是Cookie与Session
工作原理:客户端请求服务器,如果服务器需要记录该用户状态,检查这个客户端的请求里面是否包含了sessionId 。
①如果已包含则说明以前已经为此客户端创建过session,服务器就按照sessionId把这个session检索出来使用(检索不到,会新建一个),服务器还可以根据需要修改Cookie的内容,响应给客户端
②如果客户端请求不包含sessionId,则为此客户端创建一个session并且生成一个与此session相关联的sessionId,把sessionID放在cookie中,使用response返回给客户端浏览器cookie,cookie将被在客户端保存 。
客户端携带sessionid的常见方式:cookie(服务器生成的,传给客户端体积很小的纯文本文件)中携带sessionID,会附在请求资源的HTTP请求头上发送给服务器,服务器通过相应方法获得该cookie 。对于不支持cookie的手机浏览器,有另一种解决方案:URL地址重写 。URL地址重写的原理是将该用户session的id信息重写到URL地址中,服务器能够解析重写后的URL获取session的id 。这样即使客户端不支持cookie,也可以使用session来记录用户状态 。
cookie:
①会话cookie:若不设置过期时间,则表示这个cookie的生命期为浏览器会话期间,关闭浏览器窗口,cookie就消失 。这种生命期为浏览器会话期的cookie被称为会话cookie 。会话cookie一般不存储在硬盘上而是保存在内存里 。
②持久cookie:若设置了过期时间,浏览器就会把cookie保存到硬盘上,关闭后再次打开浏览器,这些cookie仍然有效直到超过设定的过期时间 。存储在硬盘上的cookie可以在不同的浏览器进程间共享,这种称为持久Cookie 。如果cookie没有失效的前提下,游客身份多次访问会判断为同一用户 。
应用场景举例:登录网站时用户第一天输入用户名密码登录了,第二天再打开很多情况下就直接打开了 。因为第一次登录时就把身份认证信息通过加密的方式保存在了cookie中 。
session相当于程序在服务器上建立的一份用户的档案,在用户第一次访问服务器的时候自动创建,后续来访时只需要查询用户档案表就可以了 。只要用户继续访问,服务器就会更新Session的最后访问时间,并维护该session 。为防止内存溢出,服务器会把长时间内没有活跃的session从内存中删除 。这个时间就是session的超时时间 。如果超过了超时时间没访问过服务器,session就自动失效了 。后续用户再访问时会创建一个新的session 。
应用场景举例:一个未登录的用户添加了商品之后客户端处可以知道添加了哪些商品,而服务器端如何判别呢,所以也需要存储一些信息就用到了session 。每次用户添加商品时,都会根据cookie和session的对应关系把该商品添加到session中 。如果用户手动清除了cookie,那么购物车也会同步清空 。
4. 原理小结
客户端和服务器端通过http协议进行数据传递,按照一定的规则把所有的请求和响应分割成一定数量会话,通过会话能分析出用户访问网站的频次、路径、时长等关键信息 。因为http协议是无状态的,所以引用会话跟踪技术进行不同用户访问网站完整流程的记录,其中cookie和seession是常用的会话跟踪技术之一 。
cookie是通过在客户端记录信息确定用户身份的,而session则通过在服务器端记录信息确定用户身份 。
二、用户数据分析常见指标
不同业务的产品需要关注的数据指标有所差异 。在这里从用户角度来分析从首次使用产品到最后离开产品的整个流程——新增(首次使用)、活跃(如何使用)、留存(继续使用)、流失(不再使用) 。
1. 新增(首次使用)
首次使用产品的用户称为新增用户,可以按照不同的属性进行群体的划分,例如不同性别、不同年龄段、不同地区的用户群体 。
常用的新增用户群体为新增实名用户和新增匿名用户 。新增实名用户指的是新注册并在数据库中生成账号的用户 。新增匿名用户指的是对比数据库没有出现过的cookie或者设备的游客,一般来说,JS的新增是只要打开网站就会记为新增,而app只有下载打开后才会被记为新增 。
新用户数量的快速增长,是产品增长的基础 。通常一个运营活动上线或者进行渠道投放后,会产生比较多的新增用户,业务会关注后续的日增、周增、月增 。
2. 活跃(如何使用)
活跃用户的定义取决于业务本身,登录、消费、浏览指定模块的内容、使用时长达到一定的时间等行为都能成为判断活跃用户的标准 。只有活跃用户才有可能会产品带来流量或者营收价值,是投资人关注的重要指标 。
活跃用户的统计需要去重 。例如某款产品把登录做为活跃用户的判断标准,在某段时间内使用过产品的用户被记录下来,多次启用过产品的不会重复计算 。场景举例:如A公司6月23日~7月4日期间的活跃用户位1890,那么就是在6月23日~7月4日期间一共有1890人使用过产品,但是其中340名用户在此期间使用5次以上,但是记在计算活跃用户时不会重复计算,只会计算为1个 。
使用会话技术跟进用户的行为路径,可以统计更多的数据了解用户对产品使用情况,从而针对性地去优化产品功能设计或者内容本身 。
  • PV(访问量):即Page View, 即页面浏览量,用户每次刷新即被计算一次 。
  • UV(独立访客):即Unique Visitor,访问网站的不同IP地址的访客数 。在同一天内,uv只记录第一次进入网站的具有独立IP的访问者,在同一天内再次访问该网站则不计数 。
  • 访问次数:产生会话的次数,会话时长的计算为同一次访问内触发的最后一个事件的时间减去会话开始的时间 。
  • 平均使用时长:会话的总时长 / 会话次数 。
  • 使用时长分布:划分不同的时间区间,查看对应区间的访问人数情况 。
  • 退出率:该网页是会话中“最后一页”的浏览次数占该网页总浏览次数的百分比 。退出率=退出次数/总访问量*100%
  • 跳出率:该网页是会话中“唯一网页”的会话次数占由该网页开始的所有会话次数的百分比 。跳出率=会话的开始和结束都是该页的次数/会话的开始是该页的次数*100%
3. 留存(继续使用)
留存指的是某种类型的用户在经过一段时间后仍旧满足某种条件或者保持某个状态 。常见的留存为新增用户留存和活跃用户留存 。
新增用户留存指的是某段时间内的新增用户,经过一段时间后,仍然继续使用产品被称为新增留存;这部分用户占当时新增的比例就是留存率 。场景举例:某产品,1月份新增用户10000人;2月时10000人中还有8000人使用产品,则新增留存人数为8000,新增留存率为80%;3月份10000人中还有7000人使用产品,则新增留存人数为7000,新增留存率为70% 。
活跃用户留存的定义:某段时间内的活跃用户,经过一段时间后,仍然继续活跃的用户被称为活跃留存;这部分活跃留存用户占当时活跃用户的比例就是活跃留存率 。场景举例:某产品,1月份的活跃用户数是10万人,2月时10万人中还有5万人活跃,则活跃留存人数为5万,活跃留存率为50%;3月份,10万人中还有4万人活跃,则活跃留存人数为4万,活跃留存率为40% 。
用户留存率需要较长的时间去观察,所以能更多地反应产品体验、用户需求满足程度、市场竞争力等问题 。产品的留存率足够高,新增用户投入的成本才有价值,才能促进业务更好地持续发展,是投资人关注的重要指标 。
4. 流失(离开)
理论上只要用户没有注销,就可以认为用户没有流失 。但实际上一般会根据业务情况给定一个主观的判断标准,用户多久没有活跃来判定用户是否流失 。例如3个月未登录,6个月没有消费等 。对于流失的用户,会定制用户的召回策略,例如发优惠劵、电话访问沟通、赠送会员等 。当然有些用户流失和用户本来的生命周期相关,这是无法避免的 。例如考研产品的用户已经考研成功之后便不再使用该产品 。
三、用户数据分析小结
通过用户属性和行为数据分析,可以根据业务需求统计出具有***属性,新增/活跃于***时间段,做过/没做过****的用户群体,针对不同特性的群体进行针对性的营销策略从而达成业务目标 。
目前常见的第三方数据分析工具,例如诸葛IO、友盟都支持不同终端的数据统计,只需要接入SDK就能自动统计用户以及行为数据 。不同的平台统计的数据的标准会稍有差异 。对于精细化运营的需求,可以在借助第三方平台进行精准化埋点或者在资源的支持下开发自研数据统计平台 。
指标的是否需要关注以及指标的定义等需要根据业务情况具体分析~好啦,本次此结束,后续有机会给大家详细漏斗模型、归因模型等常见的数据分析模型~

    推荐阅读