数据挖掘必备知识总结

平台:linux(Shell)

软件:R,SAS,Spss,weka,IBM IM,Mathout

语言:Java,Python,PHP,MapReduce编程,Ruby

数据库:SQL,MySQL

算法:数据挖掘机器学习算法备注:(C4.5(分类决策树)、

                   k-means、

                   SVM、

                   Apriori、

                   EM(最大期望算法)、 

                   PageRank、

                   AdaBoost、

                   KNN、

                   朴素贝叶斯、

                   CART(分类与回归树)等常用算法的适用场景、优点、缺点以及弥补办法;)

     搜索引擎(推荐算法,反作弊,排序)

   分布式框架:Hadoop(Hive,HBase),Storm,Spark

 

原文地址:https://www.cnblogs.com/chamie/p/4553260.html