Apriori算法

中心思想:

频繁度高的项对应的子项频繁度也高,频繁度低的项对应子项频繁度也低

对子项求频繁度,选择频繁度高的子项求其所在项的频繁度。

1.求出单个属性的频繁度,过滤低于最小频繁度的项

2.求出两个项的频繁度,过滤低于最小频繁度的项

3.优化聚合,将两个项的数据分别选择第一项相同的值进行聚合,得到三项数据,过滤低于最小频繁度的项

以此类推

原文地址:https://www.cnblogs.com/supermanwx/p/8780964.html