linux命令 awk

awk的工作流程如下:

读入有 ' ' 换行符分割的一跳记录,然后将记录按指定的域分隔划分域,填充域,$0 表示所有域, $1 表示第一个域, $n 表示第n个域。默认域分隔符为“空白键”或者“[tab]键”。

例如:

hbg@root:/$ last -n 5

yyy      pts/5        192.168.1.221    Mon Feb 29 16:07   still logged in  
mmm   pts/4        192.168.2.201    Mon Feb 29 14:22   still logged in  
zzz      pts/3        192.168.1.221    Mon Feb 29 14:00   still logged in  
ttt       pts/2        192.168.2.201    Mon Feb 29 13:39   still logged in  
mmm   pts/0        192.168.2.201    Mon Feb 29 13:38   still logged in 

hbg@root:/$ last -n 5 | awk '{print $0}'
yyy      pts/5        192.168.1.221    Mon Feb 29 16:07   still logged in  
mmm   pts/4        192.168.2.201    Mon Feb 29 14:22   still logged in  
zzz      pts/3        192.168.1.221    Mon Feb 29 14:00   still logged in  
ttt       pts/2        192.168.2.201    Mon Feb 29 13:39   still logged in  
mmm   pts/0        192.168.2.201    Mon Feb 29 13:38   still logged in 

hbg@root:/$ last -n 5 | awk '{print $1}'
yyy     
mmm  
zzz     
ttt       
mmm   

hbg@root:/$ last -n 5 | awk '{print $2}'
pts/5       

pts/4       

pts/3         
pts/2       
pts/0       

-F 参数可以指定域分隔符“:”。

hbg@root:/$ cat etc/passwd
root:x:0:0:root:/root:/bin/bash
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync

hbg@root:/$ cat etc/passwd | awk -F ':' '{print $1}'
root
daemon
bin
sys
sync

关键字 BEGIN 先执行BEGIN,然后读取文件读入有 换行符分隔的一条记录,然后将记录按指定的域分隔符划分域,填充域。最后执行END。

awk中提供了 print 和 printf两种打印输出函数。

其中print函数的参数可以是变量、数值或者字符串。字符串必须使用双引号引用,参数用逗号分隔,如果没有逗号,参数就串联在一起而无法区分。这里逗号的作用与输出文件的分隔符的作用是一样的,只是后者是空格而已。

printf函数,其用法和 C语言中printf基本相似,可以格式化字符串,输出复杂时,printf更好用,代码更容易懂。

原文地址:https://www.cnblogs.com/rohens-hbg/p/5227915.html