awk-第一篇

awk 【单独的编程语言解释器】

1、awk介绍

全称:Aho Weinberger Kernaighan三个人的首字母缩写;

1970年第一次出现在Unix机器上,后来在开源领域使用它;

所以,我们在linux中使用,改名为GNU awk;在linux上实际上叫做gawk

gcc---c语言的解释器

 

RSA

Grep 行过滤器

        -o -I -v -E egrep fgrep grep

Sed 行编辑器/流编辑器

        将每一行依次放入模式空间中进行操作

        -n p---打印

              地址定界3,5 命令p a i w c    s/pattern/string/g|1|2…|&

Awk 报告生成器   【默认情况下,三个工具都不编辑源文件】

通过模式匹配以及自己本身的语言格式,来获取并输出客户所需要的内容;

例子:获取系统上面用户id小于等于500大于等于1的用户的用户名和用户ID

 

a=`awk -F: '{print $3}' /etc/passwd`

awk最后实现这个功能的时候只需要一句话

2、awk原理

属于行处理,不用去循环

与sed相同

将提取出的一行内容,默认以空格分割

$0 $1 $2

第一步,做分割

第二步,去匹配,pattern,模式匹配对应字段,过滤行(地址定界)

第三步,通过对应的命令—printf做格式化输出

【难点:关联逻辑语句,他有自己的语法格式】

依次把匹配到的行使用awk工具进行编辑或者格式化输出

【所以,关于行的循环,在awk中,就可以不用使用了】

awk -v FS=":" '{if($3>=1&&$3<=500){print $3}}' /etc/passwd

3、awk用法

awk [option]…‘program’ FILE…

program 必须使用单引号

多条program语句使用大括号包含起来,可以并列,可以嵌套

awk ‘{print}’ /etc/passwd-----默认有$0

4、option

-F 指定分隔符 可以指定多个分隔符awk -F[/:] '{print $1,$2,$3}' q.txt

 

-v 因为awk是一种语言编译器,能自己定义变量,同时也有内置变量(与环境变量类似)

        手动指定变量参数

        给a赋值,打印a这个变量

        awk -v a="a/b" '{print a}' q.txt

        a是自定义变量 -v FS=”:”

        在awk中调用变量不用加$符号

 

 

了解cut与awk的区别

5、awk自己的固定语法语句

a)       print  默认输出(在屏幕上打印一次) 在awk中没有保存命令,可以关联其他命令来保存

[root@localhost ~]# awk '{a="a/b" ; print a}' q.txt | tee q.bak

a/b

[root@localhost ~]# cat q.bak

a/b

 

b)      printf

显示格式化输出

printf  “ %s是%d班学的%c最好的学生”,$a,$b,$c

【仅仅只有顺序关系】

格式符

              %s-------------字符串

              %d %i --------数值

              %e %E--------科学计算数值

              %c ------------ACSII码值

              %%------------逃逸符  只显示%自己

              %f-------------浮点数

              %u------------无符号整数

修饰符

              默认为右对齐

-        代表左对齐

+  代表右对齐

%5.4f  5代表占位数 4代表所取小数位

awk '/^UUID/{printf "被挂载文件: %-10s 挂载点:%-10s 文件系统格式:%-10s ",$1,$2,$3}' /etc/fstab

被挂载文件: UUID=b35bca91-5dc3-4539-beb2-50f7d26389ff 挂载点:/boot      文件系统格式:xfs 

注意地址定界  sed /pattern1/,/pattern2/

c)       变量(内置变量、自定义变量)

内置变量 – 环境变量(bash)(env、set -C +C)

       Awk语言所默认支持的变量

       FS  定义输入分隔符的变量

       OFS定义输出分隔符的变量

       NF 定义的是分割以后的参数的个数($NF 分割以后最后的一列变量)

              *变量引用的时候,不用加$   $0,$1$n

              awk -v FS=":" '//bash$/{print $NF}' /etc/passwd

awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd

 

                     NR 定义的文件行数  定义多个文件的时候,行号叠加

                            awk ‘{print NR}’/etc/passwd /etc/fstab

                     FNR 文件只计算自己的行号

                            awk ‘{print NR}’/etc/passwd /etc/fstab

                     FILENAME 存储文件名字

awk ‘{print FILENAME }’/etc/passwd –文件名会被打印N次,N是文件的行数,只打印一次使用BEGIN

awk ‘BEGIN{print FILENAME }’/etc/passwd  //BEGIN{语句}----只在循环开始时执行一次

                     ARGC 整个命令的段数,[不包含命令本身]

                            cut -d: -f1 /etc/passwd  ----- 4段

                            awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow

                     ARGV 数组,用来调取命令中,指定的段ARGV[2]

                                   *注意* 数组中也不包含program

 

              RS  指定换行符 可以指定新的换行符,并不影响本身的换行符

                     awk -v RS=" " '{print}' /etc/passwd

              ORS      输出的时候指定换行符,将默认换行符替换为指定字符

awk -v ORS="@" '{print}' /etc/passwd //可以取消换行

自定义变量 -v 变量=值

                     在后面’program’中去调用自定义变量时,直接使用即可

                     或者将“变量=值”语句直接写在‘program’亦可

 

原文地址:https://www.cnblogs.com/KAJIA1/p/11392402.html