关联分析(Apriori算法)

两个概念:

频繁项集:常出现的物品集合

关联分析:找到诸如:尿布-->啤酒的关联,反过来则是另一条

两个控制参数:

项集的支持度(support):一个项集出现的次数在所有样本中出现的比例

可信度或置信度(confidence):定义为:支持度(尿布,啤酒)/支持度(尿布)

原文地址:https://www.cnblogs.com/fkissx/p/4342487.html