Frequent Pattern-FP-Tree

Frequent Pattern频繁模式:频繁地出现在数据集中的模式,算法包括Apriori算法(相见),FP-Tree算法,FP-Tree是Apriori算法的改良版本,具体算法过程可以结合Apriori算法进行理解。

前提条件:最小支持度为2

数据集,有四个事务数据 ,分别的商品包括:

事务1:1,3,4(商品id)

事务2:2,3,5

事务3:1,2,3,5

事务4:2,5

扫描数据集,统计每个商品id的数量,由于最小支持度为2,而商品id4的数量为1,不满足,并按照支持度从大到小排序,过程如下图所示:

image

然后利用有序的物品支持度集合,将事务与商品数据集合排序,过程如下

image

上图,事务1的购买商品是1,3,4,由于4商品已不符合,所以去掉,剩下商品的1,3按照支持度排序,由于3的支持度是3,1的支持度是2,所以最终的结果是3,1

按照事务1的处理方式,其他事务的处理方式相同

接下来按照有序的结果集构建FPtree,过程如下:

image

上图是项(3,1)、(2,3,5)构建Fptree的示意图。

image

上图是项(2,3,5,1)、(2,5)在之前项的基础上构建Fptree的示意图。

未完。。。。

原文地址:https://www.cnblogs.com/xiongmaotailang/p/5279943.html