关联规则Apriori算法

起因

这个学都在小学期,第一周的是数据结构的课,给了一些题目,选一个做就可以了.选了个Apriori算法的题目,之前没有认真研究过这个算法.其实除了高中那段高NOIP的日子,其他时候对算法的训练是在是缺失的很.写出来的代码也是恶心得很,一点都不简洁,也完全失去了结构化.

Apriori算法介绍

这个算法主要是来处理一些关系之间的相关性的问题.简单的例子就是那个啤酒尿布的故事.一个超市发现来帮孩子买尿布的男人,很有可能也会买一瓶啤酒,所以把啤酒喝尿布这两个东西摆在一起,最后导致两个东西的销量大增.

Apriori算法处理的问题就是在一大推销售记录里面挖掘出啤酒和尿布的关系,人们有多大概论会买尿布,有多大概论会买了尿布又买啤酒.这个的基本原理就是简单的条件概论P(A|B)=P(AB)|(B).

这个算法是在1994年才发布的.下面有论文的地址

Fast Algorithms for Mining Association Rules http://rakesh.agrawal-family.com/papers/vldb94apriori.pdf

参考资料

我不太会写这种关于算法的BOLG.可能我很懒得把别人已经讲得很清楚的东西,再讲一次.不重复开发轮子. 下面给一篇写得很好的BOLG地址

http://www.cnblogs.com/zgw21cn/archive/2009/05/31/1492809.html

另外关于代码,我写的是在是太丑陋了,就不敢忘上贴了. 不过在 https://code.google.com/p/code-sync-google/ 有我所有小代码的备份.不嫌恶心的可以去翻一翻..

原文地址:https://www.cnblogs.com/atskyline/p/2553988.html