用户留存率R的由来 以及 留存率的计算

用户留存率R的由来 以及 留存率的计算

 

R的由来

开门见山

假设我们某产品新增一批用户,新增用户总数为Num

我们设第n天时,这部分用户中留存下来的用户数为Num(n),即,第n天依旧登录/活跃的用户

 

那么,

这批用户的总生命周期为LT(all)

LT(all) = Num*1 + Num(1)*1 + Num(2)*1 +Num(3)*1 + ... + Num(n)*1

这批用户的平均生命周期LT就为

LT = LT(all)/Num = Num/NUm + Num(1)/Num + Num(2)/Num + ... + Num(n)/Num

 

这里的Num(n)/Num就是留存率R(n),就表示第n天的留存率

R(n) = 第n天的用户留存量/总用户留存量

 

LT 的一种计算方式就是

LT = 1 + SUM( R(n) )就是对每天留存率的累和

但更加准确的LT的计算方式需要更多的数据,甚至是对未来发展趋势预测出来的数据来充实LT的计算过程,使得LT更加贴合现实情况,详见

 

留存率的计算

简单来看就是

留存人数/新增人数

需要注意的是算术平均数与加权平均数对留存率的影响,详见:

https://www.zhihu.com/question/35541068 中Wise的回答

或者

https://baijiahao.baidu.com/s?id=1672723291636599258&wfr=spider&for=pc

在这里仅贴图以防止原回答丢失

图1

图2

图3

图4

在图3中可见,标红的部分数据由于使用的计算方式不用(算术平均数与加权平均数),导致T1留存率影响较大,分别是39.76%和32.91

这是因为算术平均数受极值影响大,且7月6日的新增人数暴跌时T1的留存人数刚好处于一个较高的水平。

留存率权重是如何计算出来的还没有完全搞懂,希望看官指点

 

原文地址:https://www.cnblogs.com/G-Aurora/p/13456360.html