awk-第一篇

awk 【单独的编程语言解释器】

1、awk介绍

全称：Aho Weinberger Kernaighan三个人的首字母缩写；

1970年第一次出现在Unix机器上，后来在开源领域使用它；

所以，我们在linux中使用，改名为GNU awk；在linux上实际上叫做gawk

gcc---c语言的解释器

RSA

Grep 行过滤器

-o -I -v -E egrep fgrep grep

Sed 行编辑器/流编辑器

将每一行依次放入模式空间中进行操作

-n p---打印

地址定界3,5 命令p a i w c s/pattern/string/g|1|2…|&

Awk 报告生成器【默认情况下，三个工具都不编辑源文件】

通过模式匹配以及自己本身的语言格式，来获取并输出客户所需要的内容；

例子：获取系统上面用户id小于等于500大于等于1的用户的用户名和用户ID

a=`awk -F: '{print $3}' /etc/passwd`

awk最后实现这个功能的时候只需要一句话

2、awk原理

属于行处理，不用去循环

与sed相同

将提取出的一行内容，默认以空格分割

$0 $1 $2

第一步，做分割

第二步，去匹配，pattern，模式匹配对应字段，过滤行（地址定界）

第三步，通过对应的命令—printf做格式化输出

【难点：关联逻辑语句，他有自己的语法格式】

依次把匹配到的行使用awk工具进行编辑或者格式化输出

【所以，关于行的循环，在awk中，就可以不用使用了】

awk -v FS=":" '{if($3>=1&&$3<=500){print $3}}' /etc/passwd

3、awk用法

awk [option]…‘program’ FILE…

program 必须使用单引号

多条program语句使用大括号包含起来，可以并列，可以嵌套

awk ‘{print}’ /etc/passwd-----默认有$0

4、option

-F 指定分隔符可以指定多个分隔符awk -F[/:] '{print $1,$2,$3}' q.txt

-v 因为awk是一种语言编译器，能自己定义变量，同时也有内置变量（与环境变量类似）

手动指定变量参数

给a赋值，打印a这个变量

awk -v a="a/b" '{print a}' q.txt

a是自定义变量 -v FS=”:”

在awk中调用变量不用加$符号

了解cut与awk的区别

5、awk自己的固定语法语句

a) print 默认输出（在屏幕上打印一次）在awk中没有保存命令，可以关联其他命令来保存

[root@localhost ~]# awk '{a="a/b" ; print a}' q.txt | tee q.bak

a/b

[root@localhost ~]# cat q.bak

a/b

b) printf

显示格式化输出

printf “ %s是%d班学的%c最好的学生”,$a,$b,$c

【仅仅只有顺序关系】

格式符

%s-------------字符串

%d %i --------数值

%e %E--------科学计算数值

%c ------------ACSII码值

%%------------逃逸符只显示%自己

%f-------------浮点数

%u------------无符号整数

修饰符

默认为右对齐

- 代表左对齐

+ 代表右对齐

%5.4f 5代表占位数 4代表所取小数位

awk '/^UUID/{printf "被挂载文件： %-10s 挂载点：%-10s 文件系统格式：%-10s ",$1,$2,$3}' /etc/fstab

被挂载文件： UUID=b35bca91-5dc3-4539-beb2-50f7d26389ff 挂载点：/boot 文件系统格式：xfs

注意地址定界 sed /pattern1/，/pattern2/

c) 变量（内置变量、自定义变量）

内置变量 – 环境变量（bash）（env、set -C +C）

Awk语言所默认支持的变量

FS 定义输入分隔符的变量

OFS定义输出分隔符的变量

NF 定义的是分割以后的参数的个数（$NF 分割以后最后的一列变量）

*变量引用的时候,不用加$ $0,$1$n

awk -v FS=":" '//bash$/{print $NF}' /etc/passwd

awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd

NR 定义的文件行数定义多个文件的时候，行号叠加

awk ‘{print NR}’/etc/passwd /etc/fstab

FNR 文件只计算自己的行号

awk ‘{print NR}’/etc/passwd /etc/fstab

FILENAME 存储文件名字

awk ‘{print FILENAME }’/etc/passwd –文件名会被打印N次，N是文件的行数，只打印一次使用BEGIN

awk ‘BEGIN{print FILENAME }’/etc/passwd //BEGIN{语句}----只在循环开始时执行一次

ARGC 整个命令的段数,[不包含命令本身]

cut -d: -f1 /etc/passwd ----- 4段

awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow

ARGV 数组，用来调取命令中，指定的段ARGV[2]

*注意* 数组中也不包含program

RS 指定换行符可以指定新的换行符，并不影响本身的换行符

awk -v RS=" " '{print}' /etc/passwd

ORS 输出的时候指定换行符，将默认换行符替换为指定字符

awk -v ORS="@" '{print}' /etc/passwd //可以取消换行

自定义变量 -v 变量=值

在后面’program’中去调用自定义变量时，直接使用即可

或者将“变量=值”语句直接写在‘program’亦可