053 关于hive的存储格式

1.存储格式

  textfile

  rcfile

  orc

  parquet

2.存储方式

  按行存储

    -》textfile

  按列存储

    -》parquet

3.压缩比

  

4.存储textfile的原文件

  

  并加载数据

  

5.大小

  

6.保存为textfile,经过mapreduce

  

7.结果的大小

  

8.保存为orc格式

  

9.大小

  

 10.存储为parquet

  

11.大小

  

12.使用命令求大小

   bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par

  

原文地址:https://www.cnblogs.com/juncaoit/p/6067646.html