数据仓库和非结构化数据。

数据仓库包含标准化数据。

还包含 外部数据/非结构化数据 

如果外部数据 量小 可以保持数据库内部或者专用服务器。

如果量大 只能记住地址, 在etl 加载

当然也有需求 是实时数据 比如股票  汇率 拿只能etl过程处理

非结构化数据  包含图片 ,视频 音频

 

如果是传统数据库 db2 oracle存在里面是不合适的。存储影响性能

如果是hadoop 无所谓 影响不大,

但是从使用者的角度

非结构化数据 只能转换关系使用 

建一张元数据表存储非结构化存储位置就可以了。

比如说文档之类  我需要检索。非结构化数据

建议在应用端使用soli lucnce这些检索工具

数据仓库没来就没有统计的概念。只是看大家怎么区分的。

原文地址:https://www.cnblogs.com/itxuexiwang/p/6289429.html