大数据之路 读书笔记

阿里的《大数据之路》记录了阿里的大数据系统的产生,演化和设计思路。是大数据进阶的经典书籍。

本篇读书笔记会按照《大数据之路》的目录结构,记录我在阅读这本书的时候,

  1. 名词解释
  2. 概述
  3. 结合电商业务场景的思考
  4. 摘要
  5. 以及疑惑

第一章:总述

  1. 概述:本章由马云的"人类已进入DT时代",所有行业都离不开数据的赋能切入,简单介绍了阿里的,数据采集层,数据计算层,数据服务层,数据应用层的作用和发展过程。
  2. 数据烟囱:不能与其他相关信息系统之间进行互操作或者说协调工作的数据,类似的名词还有 数据孤岛  碎片化数据等。
  3. 名词解释:
    1. 实时数仓:传统数仓的计算频率是小时,日,周或月。但随着交易过程缩短,用户对实时数据产出的实时性要求变高。如双11实时数据大屏。实时数仓的概念应运而生
  4. 摘要:
    1. 阿里数据仓库层次划分为:

待更新。。。




原文地址:https://www.cnblogs.com/drjava/p/10509901.html