linux命令 awk

awk的工作流程如下：

读入有 ' ' 换行符分割的一跳记录，然后将记录按指定的域分隔划分域，填充域，$0 表示所有域， $1 表示第一个域， $n 表示第n个域。默认域分隔符为“空白键”或者“[tab]键”。

例如：

hbg@root:/$ last -n 5

yyy      pts/5        192.168.1.221    Mon Feb 29 16:07   still logged in
mmm   pts/4        192.168.2.201    Mon Feb 29 14:22   still logged in
zzz      pts/3        192.168.1.221    Mon Feb 29 14:00   still logged in
ttt       pts/2        192.168.2.201    Mon Feb 29 13:39   still logged in
mmm   pts/0        192.168.2.201    Mon Feb 29 13:38   still logged in

hbg@root:/$ last -n 5 | awk '{print $0}'
yyy      pts/5        192.168.1.221    Mon Feb 29 16:07   still logged in
mmm   pts/4        192.168.2.201    Mon Feb 29 14:22   still logged in
zzz      pts/3        192.168.1.221    Mon Feb 29 14:00   still logged in
ttt       pts/2        192.168.2.201    Mon Feb 29 13:39   still logged in
mmm   pts/0        192.168.2.201    Mon Feb 29 13:38   still logged in

hbg@root:/$ last -n 5 | awk '{print $1}'
yyy
mmm
zzz
ttt
mmm

hbg@root:/$ last -n 5 | awk '{print $2}'
pts/5

pts/4

pts/3
pts/2
pts/0

-F 参数可以指定域分隔符“:”。

hbg@root:/$ cat etc/passwd
root:x:0:0:root:/root:/bin/bash
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync

hbg@root:/$ cat etc/passwd | awk -F ':' '{print $1}'
root
daemon
bin
sys
sync

关键字 BEGIN 先执行BEGIN,然后读取文件读入有换行符分隔的一条记录，然后将记录按指定的域分隔符划分域，填充域。最后执行END。

awk中提供了 print 和 printf两种打印输出函数。

其中print函数的参数可以是变量、数值或者字符串。字符串必须使用双引号引用，参数用逗号分隔，如果没有逗号，参数就串联在一起而无法区分。这里逗号的作用与输出文件的分隔符的作用是一样的，只是后者是空格而已。

printf函数，其用法和 C语言中printf基本相似，可以格式化字符串，输出复杂时，printf更好用，代码更容易懂。