关联分析

学习目标:熟练掌握购物车分析法的三个维度,并结合维恩图来进行有效分析。同时,能够采用卡方检验来做有效验证。

一、作用

关联分析的主要作用,在于研究两个产品之间是否存在关联。如果确实存在关联性,则可以通过产品组合来达到更佳的效果。

   例如:在超市中,买方便面的人常常会顺带买“泡面伴侣”火腿肠,说明方便面与火腿肠存在正向关联,将这两者进行“打包”并且优惠销售,不仅会提升客单价,也将促进销量销量的增加。

二、本质

关联分析,本质上研究的是一种条件概率

1、先验概率

 先验概率,指的是不做任何干预,自然发生的结果,或者自然发生的概率,一般表示为P(A)。

例如,在1000名顾客中,买方便面的人有50人,买火腿肠的人有30人,那么正常情况下,买泡面概率P(方便面)=5%,买火腿肠概率P(火腿肠)=3%。

再比如,将某个没见过的人按性别分,成为男性的概率P(男)=50%,成为女性的概率P(女)=50%。

2、条件概率

  条件概率,和先验概率是相对的,它指的是在某个条件下(B),产生某种结果(A)的概率,一般表示为P(A|B)。其中,B为前条件,A为结果。

  例如,在1000名顾客中,买方便面的人有50人,买了方便面之后又买火腿肠的人有26人,那么此时的概率P(火腿肠|方便面)=52%。

   条件概率越大,关联性就越高,两个产品的黏性就越强,越适合于做组合推广。

三、购物车分析法

关联算法的研究,最早来源于购物车分析法。

购物车分析法,从支持度,置信度和提升度三个方面来进行关联分析。

由于是通过顾客的购物小票所进行的分析,因此这种分析方法被称为“购物篮分析法”,或者“购物车分析法”

1、支持度

    支持度,指的是在所有的顾客中,同时购买这两种商品的人数的比例,支持度越高,说明同时购买两种商品的顾客基数越大,越有研究的实际价值。

2、置信度

    置信度,指的是购买了一种产品的顾客中,同时又去购买另外一种商品的人数比例。置信度,实际上就是一种条件概率,购买“第一商品”为前提,再购买“第二商品”为结果 

  因此,置信度可以表示为P(第二商品|第一商品)

3、提升度

    提升度,指的是买了第一种商品之后又去买第二商品的顾客比例,是否比所有顾客中直接买第二种商品的人数的比例来的更高。

   提升度,实际上是条件概率P(第二种商品|第一种商品)与先验概率P(第二种商品)间的比较。如果条件概率越大,则说明两个产品存在正向关联,比值越大,关联性就越强。

   提升度=P(第二种商品|第一种商品)/P(第二种商品)

  其中,如果提升度>1,说明两种产品有正关联;如果提升度≈1,说明两种产品无显著关联;如果提升度<1,说明两种产品有负关联。

  需要注意的是,在实际的市场活动中。提升度>3才比较有现实意义。

原文地址:https://www.cnblogs.com/LWH999/p/12063852.html