频繁项集------->产生强关联规则的过程

频繁项集------->产生强关联规则的过程

1.由Apriori算法(当然别的也可以)产生频繁项集

2.根据选定的频繁项集,找到它所有的非空子集

3.强关联规则需要满足最小支持度和最小置性度   (假设关联规则是:A=>B  , support(A=>B)=  { P(AUB) }     confidence(A=>B)=P(B|A)={  P(AUB)/P(A)  }  。这里求概率都可以替换为求支持度计数(就是统计在源数据表中各个出现的次数,例如:P(AUB) 就找A和B在源数据表中同时发生了多少次)

4.找到所有可能性的关联规则。例如:频繁项集为:{1,2,3} -------->非空子集则为:{1,2},{1,3},{2,3},{1},{2},{3}---------->可能的关联规则为:{1,2}=>3 , {1,3}=>2 , {1,3}=>2 , 1=>{2,3},2=>{1,3},3=>{1,2}

5.最后计算所有可能的关联规则的置信度,找到符合最小置信度(会给出)的规则,它们则为强关联规则。

原文地址:https://www.cnblogs.com/soyo/p/8202973.html