#数据挖掘与数据化运营实战#2.3数据挖掘技术以及在数据化运营中的应用

编号

数据挖掘技术

应用

算法

优势

劣势

1

决策树(Decision Tree)

用户划分、行为预测、规则梳理

CHAID
CART
ID3、C4.5、C5.0

1、决策树的构造不需要任何领域的知识,很适合探索式的知识发掘,并且可以处理高维度的数据
2、决策树所产生的一系列从树根到树枝(或树叶)的规则,可以很容易地被分析师和业务人员理解,而且这些典型的规则甚至不用整理(或稍加整理),就是现成的可以应用的业务优化策略和业务优化路径
3、决策树技术对数据的分布甚至缺失非常宽容,不容易受到极值的影响

  

2

神经网络

用户划分、行为预测、营销响应

反馈传播

1、自适应性、自组织性和高容错性,并且具有较强的学习、记忆和识别功能

1、知识和结果的不可预测性

3

回归

预测、分类、"二选一"事件

逻辑回归

1、很好地回答预测、分类等数据化运营中常见的分析项目主题

  

4

关联规则

推荐

Apriori算法

  

  

5

聚类

用户划分;可以作为数据探索的工具,包括发现离群点、孤立点,数据降维的手段和方法,通过聚类发现数据间的深层次的关系等

划分的方法(K-Means)

  

  

层次的方法

基于密度的方法

基于网格的方法

基于模型的方法

6

贝叶斯分类方法

分类问题的归类等应用场景

朴素贝叶斯

  

  

7

支持向量机

预测、分类

  

1、对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合

1、训练数据较大

8

主成分分析

数据处理、降维、变量间关系探索

  

  

  

9

假设检验

运营效果评估

  

  

  

原文地址:https://www.cnblogs.com/applre/p/4695335.html