广义数据分析的三个方向

  1. 数据分析。专注于中小网站分析优化,网站地图、结构优化,SEO。多使用第三方工具如:开源分析模块 (BIRT),CNZZ,Google Analytics(以下简称GA)。通过对网站属性数据(如pv, uv, 新用户占比,搜索词,跳出率,蹦失率,访问时长,忠诚度等)的分析,对网站结构、内容进行优化。此方向更偏产品一些,极大的依赖分析经验和对数据的敏感 度。
    代表人物Justin Cutroni,网站分析领军人物,精通GA/GWO,作有博客Analytics Talk:http://cutroni.com/blog/
    国内代表人物宋星,经营网站分析在中国:chinawebanalytics.cn/...,蓝鲸,经营蓝鲸的网站分析笔记:http://bluewhale.cc/,Joegh,经营网站数据分析:http://webdataanalysis.net/
  2. 数据挖掘。 数据挖掘主要是面向决策,从海量数据中挖掘不为人知、无法直观得出的结论。例如内容推荐、相关度计算等。此工作更注重数据内在联系,数据仓库组建,分析系 统开发,挖掘算法设计,甚至很多时候要亲力而为的从ETL开始处理原始数据,因此对计算机水平有较高要求。一般广度上不及数据分析,但深度上更为深入。使 用工具除海量数据库如Oracle,分布式计算Hadoop,C++,Java,Python等编程语言外,也有可能会用到第三方挖掘工具如Weka。
    此方向更偏技术一些,代表人物Jeff Hammerbacher,曾经的Facebook首席科学家,曾参与编写《数据之美》,部分内容如下:
    360doc.com/content...
    延伸阅读《探索推荐引擎内部的秘密》,可以体验一下数据挖掘的魅力:
    ibm.com/develope...
    ibm.com/develope...
    ibm.com/develope...
  3. 数据统计。专注于建模及统计分析,通过概率、统计、离散等数学知识建立合理模型,充分发掘数据内容。例如用回归分析,充分利用网站历史数据,进行评估、预测、反向预测、发掘因素。利用贝叶斯方法建立模型来进行机器学习、聚类、垃圾邮件过滤等。常用工具如:SAS,R,SPSS。
    此方向更偏重数学,尤其是统计学。像哈佛数学毕业的Hammerbacher在这方面也很强。数据统计不局限于互联网,像传统行业尤其是医疗、金融等领域中,用处也是极大。
原文地址:https://www.cnblogs.com/end/p/2392078.html