cat命令

cut命令

作用

cut命令主要用于裁剪文本每行中的数据

主要参数:

-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。

-c :以字符为单位进行分割。

-d :自定义分隔符,默认为制表符。

-f :与-d一起使用,指定显示哪个区域。

-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的范围之内,该字符将被写出;否则,该字符将被排除。

 -s表示不包括那些不含分隔符的行,只切割和显示匹配的字符 

-c和-f参数可以跟以下子参数:
m第m个字符或字段
m-从第m个字符或字段到文件结束
m-n从第m个到第n个字符或字段
-n从第1个到第n个字符或字段

事例

三种定位方法:

以字节定位-b

[jeck@localhost ~]$ cat test

aa aa

bb aa

cc aa

dd AA

[jeck@localhost ~]$ cut -b 1 test

a

b

c

d

以字符定位-c

[jeck@localhost ~]$ cat test

星期一

星期二

星期三

星期四

[jeck@localhost ~]$ cut -b 3 test

?

?

?

?

[jeck@localhost ~]$ cut -c 3 test

-c处理的是一个字符,而-b处理的是一个字节。所以。当出现汉字时,使用-b就会乱码,可以加-n,使不拆分字节

以域定位 -f -d

[jeck@localhost ~]$ cat test

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

[jeck@localhost ~]$ cut -d : -f 2 test

b

2

11

nn

[root@localhost tmp]# cut -d : -f1,2 test  

a:b

1:2

aa:11

dd:nn

[root@localhost tmp]# cut -d : -f1-3 test   

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

-s 用法

[root@localhost tmp]# cat test 

a:b:c

1:2:3

aa:11:bb

dd:nn:mm

vv-aa-22

dd-44-55

[root@localhost tmp]# cut -d : -f1 test      下面两行不匹配,会全部打印

a

1

aa

dd

vv-aa-22

dd-44-55

[root@localhost tmp]# cut -d : -f1  -s test  加-s之后,只切割匹配的

a

1

aa

dd

--output-delimiter指定打印的分隔符

[root@localhost tmp]# cut -d : -f1,3  -s --output-delimiter="****" test   

a****c

1****3

aa****bb

dd****mm

区分空格和制表符

使用sort -n l 即可

[jeck@localhost ~]$ cat test1

aa bb

11      22

[jeck@localhost ~]$ sed  -n l test1

aa bb$

11 22$

如果是制表符(TAB),那么会显示为 符号,如果是空格,就会原样显示

原文地址:https://www.cnblogs.com/pycode/p/8734233.html