【三剑客】sed命令

1. Sed 简介

sed 是Stream Editor（流编辑器）的缩写，是操作、过滤和转换文本内容的强大工具。常用功能有增删改查，过滤，取行。

sed 是一种新型的，非交互式的编辑器。

它能执行与编辑器vi 和 ex 相同的编辑任务。

sed 编辑器没有提供交互式使用方式，使用者只能在命令行输入编辑命令、指定文件名，然后在屏幕上查看输出。

sed 编辑器没有破坏性，它不会修改文件，除非使用 shell 重定向 来保存输出结果。

默认情况下，所有的输出行都被打印到屏幕上。

# 查看sed软件版本
[root@oldboy ~]# sed --version
GNU sed version 4.2.1

2. sed 工作过程

sed 编辑器逐行处理文件（或输入），并将输出结果发送到屏幕。

sed 的命令就是在 vi 和 ed/ex 编辑器中见到的那些。

sed 把当前正在处理的行 保存在一个临时缓存区，这个缓存区称为模式空间或临时缓冲。

sed 处理完模式空间中的行后（即在该行上执行 sed 命令后），就把该行发送到屏幕上（除非之前有命令删除这一行或取消打印操作）。

sed 处理完输入文件的最后一行后，sed 便结束运行。

sed 把每一行都存在临时缓存区，对这个副本进行编辑，所以不会修改或破坏源文件。

概括流程：

sed软件从stdin读取加载一行，判断是否符合执行操作条件：

若不符合，则读取下一行，将下一行文本加载到模式空间；
若符合条件，则执行相应的命令操作，就将该行内容发送到屏幕上。

逐行进行，直至最后一行，结束。

3. Sed 命令格式

sed命令行格式为：sed [选项] 'command' 输入文本

　　　　sed [options] [sed-commands] [input-file]
　　　　sed [选项] [sed命令] [输入文件]

说明：
1. 注意sed和后面的选项之间至少有一个空格。
2. 为了避免混淆，本文称呼sed为sed软件。sed-commands(sed命令)是sed软件内置的一些命令选项，为了和前面的options(选项)区分，故称为sed命令。
3. sed-commands既可以是单个sed命令，也可以是多个sed命令组合。
4. input-file(输入文件)是可选项，sed还能够从标准输入如管道获取输入。

sed 定位

sed 命令在没有给定的位置时，默认会处理所有行。

sed 支持以下几种地址类型：

first~step
- first 指起始匹配行
- sed -n 2~5p
  - 从第二行开始匹配，隔5行匹配一次，即2，7，12，...
$
- 表示匹配最后一行
- sed -n '$p' person.txt
/REGEXP/
- 表示匹配正则那一行，通过//之间的正则来匹配
cREGEXPc
- 表示匹配正则那一行，通过c和c之间的正则来匹配，c可以是任一字符
addr1, addr2
- 定址 addr1，addr2 决定用于对哪些行进行编辑。地址的形式可以是数字、正则表达式或二者的结合
- 如果没有指定地址，sed 将处理输入文件中的所有行。
- 如果定址是一个数字，则这个数字代表行号，如果是逗号分隔的两个行号，那么需要处理的定址就是两行之间的范围（包括两行在内）。范围可以是数字，正则或二者组合。
addr1，+N
- 从addr1 这行到往下 N行匹配，总共匹配N+addr1 行

addr1，~N

匹配从addr1开始，到找到N的倍数行结束。
从第13行开始，到5的倍数行结束，这里即第15行结束：
sed -n "13,~5p" sed_test.txt

# 前面的输出为行号，后面为找到的匹配的值，符合N的倍数规则
[root@oldboy /]# cat sed_test.txt -n|sed '/aa/,~2p' -n         
   101  aa
   102  bb
   108  aa
   109  1
   110  2
   113  aa
   114  5
   117  aa
   118  AAA

指定执行的地址范围：

sed软件可以对单行或多行进行处理。如果在sed命令前面不指定地址范围，那么默认会匹配所有行。
用法：n1[,n2]{sed-commands}
地址用逗号分隔的，n1,n2可以用数字、正则表达式、或二者的组合表示。
例如：
- 10{sed-commands} 对第10行进行操作
- 10,20{sed-commands} 对第10到20行进行操作，包括第10和20行
- 10，+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行
- 1~2{sed-commands} 对1,3,5,7,……行操作
- 10,${sed-commands} 对10到最后一行（$代表最后一行）操作，包括第10行
- 10,~20 对10行到20的倍数行
正则匹配和其他方式的混合的方式：
- /oldboy/{sed-commands} 对匹配oldboy的行操作
- /oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作
- /oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作
- /oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作，注意：如果前10行没有匹配到oldboy，sed软件会显示10行以后的匹配oldboy的行，如果有。
- 1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作
- /oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行

sed的常用选项

-n 使用安静模式，在一般情况下所有的STDIN都会输出到屏幕上，-n选项只打印被sed 特殊处理的行
-e 多重编辑，且命令顺序会影响结果
-f 指定一个sed脚本文件到命令行执行
-r 可以使用扩展正则
-i 直接修改文档读取的内容，不在屏幕上输出

sed 操作命令

sed 操作命令告诉sed 如何处理由地址指定的各输入行。如果没有指定地址，sed就会处理输入的所有的行。

增

a 在当前行后添加一行或多行 add
- sed '5a 106,dandan,CSO' person.txt
i 在当前行之前插入文本 insert
- sed '2i 106,dandan,CSO' person.txt

删

d 删除行 delete

改

c 用新行替换旧行：用新文本修改（替换）当前行中的文本 change
s 用一个字符串替换另一个
- 单独使用，将每一行中第一处匹配的字符串进行替换，sed命令
- g 每一行进行全部替换，是sed命令s的替换标志之一，非sed命令
- 替换格式：
  - sed -i 's#old text#new text#g' filename_stdin
-i 修改文件内容，sed软件的选项
-r 可以使用扩展正则表达式
() 1 后向引用，分组替换，与-r结合使用，可以不使用转义符号；
- 最多可以用上9个分组
$var 可以使用变量，双引号会解析变量
& 代表被替换的内容

查

p 打印行，输出指定内容，但默认会输出2次匹配的结果，因此使用-n取消默认输出

h 把模式空间里的内容复制到暂存缓冲区
H 把模式空间里的内容追加到暂存缓冲区
g 取出暂存缓冲区里的内容，将其复制到模式空间，覆盖该处原有内容
G 取出暂存缓冲区里的内容，将其复制到模式空间，追加在原有内容后面
l 列出非打印字符
n 读入下一输入行，并从下一条命令而不是第一条命令开始处理
q 结束或退出sed
r 从文件中读取输入行
! 对所选行意外的所有行应用命令

替换标志：

g 在行内进行全局替换 global
p 打印行
w 将行写入文件
x 交换暂存缓冲区与模式空间的内容
y 将字符转换为另一字符（不能对正则表达式使用y命令）

报错信息和退出信息

遇到语法错误时， sed 会向标准错误输出发送一条相当简单的报错信息。

但是，如果 sed 判断不出错在何处，它会“断章取义”，给出令人迷惑的报错信息。

如果没有语法错误， sed 将会返回给 shell 一个退出状态，状态为 0 代表成功，为非 0 整数代表失败。

4. 实例

统一实例文本：

[root@oldboy test]# cat person.txt
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

增删改查

增

a 追加文本到指定行后
i 插入文本到指定行前

这两个参数和vi编辑器的意思是一样的，i是insert插入，a是add增加

单行增加：

# 5a 在第五行之后添加文本
[root@oldboy test]# sed '5a 106,dandan,CSO' person.txt   
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO
106,dandan,CSO

# 2i  在第二行之前添加文本
[root@oldboy test]# sed '2i 106,dandan,CSO' person.txt
101,oldboy,CEO
106,dandan,CSO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 打印person.txt，发现add的文本未写入文件
[root@oldboy test]# cat person.txt
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

多行增加：

# 第一种写法：
换行符
[root@oldboy test]# sed '2a 106,dandan,CSO
107,bingbing,CCO' person.txt  
101,oldboy,CEO
102,zhangyao,CTO
106,dandan,CSO
107,bingbing,CCO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 第二种写法：通过""(回车) 多行输入
[root@oldboy test]# sed '2a 106,dandan,CSO 
> 107,bingbing.CCO' person.txt
101,oldboy,CEO
102,zhangyao,CTO
106,dandan,CSO 
107,bingbing.CCO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

企业案例：

在我们学习系统优化时，有一个优化点：更改ssh服务远程登录的配置。

主要的操作是在ssh的配置文件加入下面5行文本。(下面参数的具体含义见其他课程。)

Port 52113
PermitRootLogin no
PermitEmptyPasswords no
UseDNS no
GSSAPIAuthentication no

我们可以使用vi命令编辑这个文本，但这样就比较麻烦，现在想一条命令增加5行文本到第13行前？

sed '13i Port 52113
PermitRootLogin no
PermitEmptyPasswords no
UseDNS no
GSSAPIAuthentication no' /etc/ssh/sshd_config

删

d 删除行 delete

# 删除所有行
[root@oldboy test]# sed 'd' person.txt

# 删除第2行
[root@oldboy test]# sed '2d' person.txt
101,oldboy,CEO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 删除第2到第5行
[root@oldboy test]# sed '2,5d' person.txt
101,oldboy,CEO

# 删除第三行到最后一行
[root@oldboy test]# sed '3,$d' person.txt
101,oldboy,CEO
102,zhangyao,CTO

# 删除1，3，5行，剩余2，4行
[root@oldboy test]# sed '1~2d' person.txt
102,zhangyao,CTO
104,yy,CFO

# 删除1-3行，剩余4，5行
[root@oldboy test]# sed '1,+2d' person.txt
104,yy,CFO
105,feixue,CTO

# 删除匹配到zhangyao的行
[root@oldboy test]# sed '/zhangyao/d' person.txt
101,oldboy,CEO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 删除匹配到oldboy的行到匹配到Alex的行
[root@oldboy test]# sed '/oldboy/,/Alex/d' person.txt           
104,yy,CFO
105,feixue,CTO

# 删除从匹配到oldboy的行到第三行，剩余4，5行
[root@oldboy test]# sed '/oldboy/,3d' person.txt       
104,yy,CFO
105,feixue,CTO

特殊情况：正则匹配的行不在后面的行的范围限制内，直接匹配到第五行，并删除第五行，第2行保留。
原因：正则范围内的行首，没匹配到还会继续匹配下去

[root@oldboy test]# cat person.txt
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO
[root@oldboy test]# sed '/feixue/,2d' person.txt
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO

企业案例：打印文件内容但不包含oldboy

[root@oldboy test]# sed '/oldboy/d' person.txt
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

改

c 用新文本修改（替换）当前行中的文本 change

按行替换：

# 将第二行内容修改
[root@oldboy test]# sed '2c 106,dandan,CSO' person.txt
101,oldboy,CEO
106,dandan,CSO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 不指定行号，则会修改全部行
[root@oldboy test]# sed 'c 106,dandan,CSO' person.txt 
106,dandan,CSO
106,dandan,CSO
106,dandan,CSO
106,dandan,CSO
106,dandan,CSO

文本替换：

s：单独使用→将每一行中第一处匹配的字符串进行替换 ==>sed命令
g：每一行进行全部替换 ==>sed命令s的替换标志之一，非sed命令
-i：修改文件内容 ==>sed软件的选项

sed软件替换模型(方框▇被替换成三角▲)

sed -i 's/▇/▲/g' oldboy.log
sed -i 's#▇#▲#g' oldboy.log

观察特点：

两边是引号，引号里面的两边分别为s和g，中间是三个一样的字符"/" 或 "#" 作为定界符。"#"能在替换内容包含"/" 有助于区别。定界符可以是任意符号如":"或"|"等，但当替换内容包含定界符时，需转义即":" "|"。经过长期实践，建议大家使用"#"作为定界符。
定界符"/" 或 "#"，第一个和第二个之间的就是被替换的内容，第二个和第三个之间的就是替换后的内容。
s#▇#▲#g，▇能用正则表达式，但▲不能用，必须是具体的。
默认sed软件是对模式空间(内存中的数据)操作，而-i选项会更改磁盘上的文件内容。

#### [root@oldboy test]# cat person.txt
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

# 将zhangyao替换为oldboyedu
[root@oldboy test]# sed 's#zhangyao#oldboyedu#g' person.txt
101,oldboy,CEO
102,oldboyedu,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

企业案例：指定行修改配置文件，防止修改多处

[root@oldboy test]# sed '3s#0#9#g' person.txt
101,oldboy,CEO
102,zhangyao,CTO
193,Alex,COO
104,yy,CFO
105,feixue,CTO

变量替换：

# 创建一个新的测试文本
[root@oldboy test]# cat test.txt
a
b
a

# 定义变量x，y
[root@oldboy test]# x=a
[root@oldboy test]# y=b

# 查看变量x，y
[root@oldboy test]# echo $x $y
a b

# 将变量x替换成变量y，也就是a替换成b
[root@oldboy test]# sed "s#$x#$y#g" test.txt
b
b
b
[root@oldboy test]# sed s#$x#$y#g test.txt  
b
b
b

单引号，所见即所得，不会将变量进行；
双引号，变量置换功能，解析变量后输出，不加引号相当于双引号。

[root@oldboy test]# sed 's#$x#$y#g' test.txt 
a
b
a

用eval解析：

[root@oldboy test]# eval sed 's#$x#$y#g' test.txt
b
b
b

's#'$x'#'$y'#g'是  's#'  $x  '#'  $y  '#g' 字符串和变量的拼接：

[root@oldboy test]# sed 's#'$x'#'$y'#g' test.txt
b
b
b

分组替换：

( )和1的使用说明(后向引用):

sed软件的 () 的功能可以记住正则表达式的一部分，其中，1为第一个记住的模式即第一个小括号中的匹配内容，2第二记住的模式，即第二个小括号中的匹配内容，sed最多可以记住9个。

例：echo I am oldboy teacher.如果想保留这一行的单词oldboy，删除剩下的部分，使用圆括号标记想保留的部分。

[root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*(oldboy).*$#1#g'
oldboy

[root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*am (.*) tea.*$#1#g'
oldboy

注意：

如果没有使用-r参数，就要使用转移符号将()转义；使用-r参数，表示可以使用扩展正则表达式
（）1 2 这种是后向引用的方式。

企业案例：系统开机启动项优化

[root@oldboy test]# chkconfig --list|grep '3:on'|grep -vE "sshd|crond|network|rsyslog|sysstat"|awk '{print $1}'|sed -r 's#^(.*)#chkconfig 1 off#g'|bash

特殊符号& 代表被替换的内容：

# 将第1到第3行中的C替换为"--C--"，此处：&代表C

[root@oldboy test]# sed '1,3s#C#--&--#g' person.txt
101,oldboy,--C--EO
102,zhangyao,--C--TO
103,Alex,--C--OO
104,yy,CFO
105,feixue,CTO

企业案例：批量重命名文件

[root@oldboy test]# touch stu_10299_{1..5}_finished.jpg
[root@oldboy test]# ls
person.txt                stu_10299_2_finished.jpg  stu_10299_4_finished.jpg  test.txt
stu_10299_1_finished.jpg  stu_10299_3_finished.jpg  stu_10299_5_finished.jpg

# 要求用sed命令重命名，效果为stu_102999_1_finished.jpg==>stu_102999_1.jpg,即删除文件名的_finished

[root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & 12#g' -r
mv stu_10299_1_finished.jpg stu_10299_1.jpg
mv stu_10299_2_finished.jpg stu_10299_2.jpg
mv stu_10299_3_finished.jpg stu_10299_3.jpg
mv stu_10299_4_finished.jpg stu_10299_4.jpg
mv stu_10299_5_finished.jpg stu_10299_5.jpg

[root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & 12#g' -r|bash

[root@oldboy test]# ls *.jpg
stu_10299_1.jpg  stu_10299_2.jpg  stu_10299_3.jpg  stu_10299_4.jpg  stu_10299_5.jpg

查

p 打印行，输出指定内容，但默认会输出2次匹配的结果，因此使用-n取消默认输出

按行查询:

# p参数会默认输出两次，要使用-n参数取消默认输出
[root@oldboy test]# sed '2p' person.txt
101,oldboy,CEO
102,zhangyao,CTO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

[root@oldboy test]# sed '2p' person.txt -n
102,zhangyao,CTO

# 输出第2到第3行
[root@oldboy test]# sed '2,3p' person.txt -n
102,zhangyao,CTO
103,Alex,COO

# 输出1，3，5行
[root@oldboy test]# sed '1~2p' person.txt -n    
101,oldboy,CEO
103,Alex,COO
105,feixue,CTO

# 输出所有行
[root@oldboy test]# sed 'p' person.txt -n   
101,oldboy,CEO
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

按字符串查询：

[root@oldboy test]# sed -n '/CTO/p' person.txt
102,zhangyao,CTO
105,feixue,CTO
[root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt    
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO

混合查询：

[root@oldboy test]# sed -n '/CTO/p' person.txt
102,zhangyao,CTO
105,feixue,CTO
[root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt    
102,zhangyao,CTO
103,Alex,COO
104,yy,CFO
105,feixue,CTO