数据挖掘笔记-01

数据挖掘步骤:  数据准备  数据探索  模型建立  模型评估  模型部署

数据挖掘方法分类:  关联  回归  分类  聚类  预测  诊断

数据准备:  数据收集  数据质量分析  数据预处理

数据探索:  数据可视化  数据降维  数据统计  衍生变量

关联方法:  Apriori  FP-Growth

回归方法:  一元回归  多元回归  逐步回归  Logistic回归

分类方法:  朴素贝叶斯  SVM支持向量机  神经网络  决策树  KNN近邻  逻辑斯梯模型  分类分析  判别分析

聚类方法:  K-Means聚类  层次聚类  神经网络  模糊C均值  高斯混合聚类

预测方法:  灰色预测  马尔科夫预测

诊断方法:  

  离群点监测:   基于统计   基于距离   基于密度   基于聚类

时间序列方法:  平稳时间序列方法  季节指数  时间序列模型  

智能优化方法:  遗传算法  模拟退火算法  蚁群算法

机器学习:

 数据挖掘 = 机器学习 + 数据仓库  

模式识别 = 机器学习  

统计学习 ≈ 机器学习   

计算机视觉 = 图像处理 + 机器学习  

语音识别 = 语音处理 + 机器学习  

自然语言处理 = 文本处理 + 机器学习

机器学习方法:监督学习、无监督学习:  

监督学习:   

回归算法   神经网络 ANN   支持向量机 SVM  

无监督学习:   聚类算法   降维算法  

其他学习:   推荐算法

大数据分析方法:  

大数据,小分析:OLAP,多维分析思想  

大数据,大分析:数据挖掘与机器学习  

流式分析:事件驱动架构  

查询分析:NoSql分析

机器学习的子类---》深度学习

机器学习的父类---》人工智能

原文地址:https://www.cnblogs.com/defineconst/p/5187336.html