hadoop fs –stat 命令

当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的block size,这导致HDFS上不同文件的block size是不同的。有时候我们需要知道HDFS上某个文件的block size,比如想知道该该文件作为job的输入会创建几个map等。

Hadoop FS Shell提供了一个-stat选项可以达到目的。官方文档描述这个选项时遗漏了可选参数。-stat选项的使用格式是:

hadoop fs –stat [format]
其中可选的format被官方文档遗漏了。下面列出了format的形式:
%b:打印文件大小(目录为0)
%n:打印文件名
%o:打印block size (我们要的值)
%r:打印备份数
%y:打印UTC日期 yyyy-MM-dd HH:mm:ss
%Y:打印自1970年1月1日以来的UTC微秒数
%F:目录打印directory, 文件打印regular file

注意以下几点:

1.当使用-stat选项但不指定format时候,只打印文件创建日期,相当于%y:

hadoop fs -stat file1

2015-01-06 01:43:23

2.查看文件的block size和备份个数

hadoop fs -stat "%o %r"  file1
134217728 1
 
可以看到file1件的blocksize大小为128M,有一份。
原文地址:https://www.cnblogs.com/wqbin/p/11672091.html