linux 三大利器 grep sed awk 正则表达式

正则表达式目标

 正则表达式单字符:

特定字符

范围字符:单个字符[ ] :代表查找单个字符,括号内为字符范围

  数字字符:[0-9],[259] 

                        查找 0~9 和 2、5 、9 中的任意一个字符

  小写字符:[a-z]

  大写字符:[A-Z]

  反向字符:[^0-9],[^0] 

         反向字^必须在 [ ]内才表示取反

  任意字符:代表任何一个字符:‘.’

        注意'[.]'和'.'的区别:代表查找 . 本身这个字符

单字符小结:

  •  特定字符 ‘ X’
  •     范围字符 [ ] [^]
  •     任意字符 .

正则表达式其他字符

  •  边界字符: 头尾字符 ,注意以行作为边界而不是字符串

           ^ : ^luke  表示以luke这个单词开始的,注意与[^]的区别;

                         luke@luke-virtual-machine:~$ grep '^root' passwd
          root:x:0:0:root:/root:/bin/bash

       $   false$ 表示以false单词结尾的

       ^$ : 表示空行

  • 元字符(代表普通字符或特殊字符)

        w : 匹配任何字类字符,包括下划线([A-Za-z0-9])

      W : 匹配任何字类字符,包括下划线([A-Za-z0-9])

      :代表单词的分隔

                           匹配一个单词边界,也就是指单词和空格间的位置,例如: 'er' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的'er'。

正则表达字符组合

  • 重复

     * : 零次或多次匹配前面的字符或子表达式,字表达是用()括起来,记住加反斜杠转义,(se)匹配se 0次或则多次;

     + : 一次或多次匹配前面的字符或子表达式;

     : 零次或一次匹配前面的字符或子表达式;

  • 重复特定次数:{n,m} ,匹配前面的字符或子表达式 最少n次最多m次;
  • 任意字符串的表示:.*

     例如:^r.* ,表示以r开头的任意字符串

  • 逻辑的表示

    | : 'bin/(false|true)' 逻辑或

        

实例:

    匹配4~10位的QQ号: grep '^[0-9]{4,10}$' qq.txt

    匹配15位到18位身份证号(支持带X) :^[1-9]([0-9]{13}|[0-9]{16})[0-9Xx]$

                     linux: grep '^[1-9]([0-9]){13}|[0-9]{16})[0-9Xx]$'

    匹配密码,要求字母数字以及下划线组成 w+

                      linux: '^w+$'

正则表达式总结:

   

原文地址:https://www.cnblogs.com/lukechenblogs/p/8629875.html