关联规则中的支持度与置信度

支持度(Support)的公式是:Support(A->B)=P(A U B)。支持度揭示了A与B同时出现的概率。如果A与B同时出现的概率小,说明A与B的关系不大;如果A与B同时出现的非常频繁,则说明A与B总是相关的。
置信度(Confidence)的公式式:Confidence(A->B)=P(A | B)。置信度揭示了A出现时,B是否也会出现或有多大概率出现。如果置信度度为100%,则A和B可以捆绑销售了。如果置信度太低,则说明A的出现与B是否出现关系不大。
示例:某销售手机的商场中,70%的手机销售中包含充电器的销售,而在所有交易中56%的销售同时包含手机和充电器。
则在此例中,支持度为56%,置信度为70%。
简单的描述:在所有交易中56%的销售同时包含手机和充电器(支持度为56%),70%的手机销售中包含充电器的销售(置信度为70%):在所有手机销售记录中,70%包含了充电器。
 

支持度: P(A∪B),即A和B这两个项集在事务集D中同时出现的概率。 A*B/D=支持度

置信度: P(B|A),即在出现项集A的事务集D中,项集B也同时出现的概率。 A*B/A=置信度

 

 

参考:http://baike.baidu.com/view/1076817.htm

原文地址:https://www.cnblogs.com/bobsoft/p/2714561.html