数仓的数据存储在hdfs中,业务数据和可视化数据存储在mysql中,日志数据存储在file中。爬虫得到数据一般存储在mongodb中

数仓的数据存储在hdfs中,业务数据和可视化数据存储在mysql中,日志数据存储在file中。

flume和kafka用于把日志数据file导入到hdfs中,sqoop用于把业务数据mysql的数据导入到hdfs中

原文地址:https://www.cnblogs.com/lidapengwww/p/12447334.html