grep与正则表达式

1.grep程序

    Linux下有文本处理三剑客 --grep sed awk

    grep:文本行过滤工具

    sed:文本行编辑器(流编辑器)

    awk:报告生成器

    grep

      包含三个命令:gerp egrep fgrep ,它们是用来进行 行模式(pattern)匹配的

      ergep=grep -E //使用扩展的正则表达式进行匹配

      fgrep =fast grep //只是用文件通配符进行匹配

                  *grep默认使用正则表达式进行文本匹配*

    grep的用法:

      grep [option]...PATTERN [filename]

      a*(在文件通配符里表示以a开头的任意字符)

    grep的常见选项 -- option

      -E  支持使用扩展的正则表达式(ERE)(regexp)

      -P  使用per语言的正则表达式引擎进行搜索(每一种语言的正则表达式引擎都不相同甚至sed grep awk使用的regexp引擎也不相同)

      -f  指定文件

      -c  统计

      -i  忽略大写小写

      -v 进行反选

      -o 仅仅输出匹配的内容(默认输出的是匹配到的行)

      --color=auto 语法着色

               

      -n 显示行号

    PATTERN--正则表达式

      作用:通过一些特殊的字符,来表示一类字符内容,然后交给前面的命令来执行;如果使用特殊字符本身含义,就需要进行转义;

      1.字符匹配

          .任意一个字符(相当于文件通配符里?)

          [ ] 范围内的任意一个字符

          [^] 范围以外的任意一个字符

          字符类:[:digit:]  [:alnum:]  [:alpha:]  [:lower:]  [:upper:]  [:space:]  [:punct:]

      2.次数匹配

          *  匹配前面的字符0次到无数次

          ?匹配前面的字符0次到1次

          + 匹配前面的字符1次到n次

          {m} 匹配前面的字符m次

          {m,n} 匹配前面的字符m到n次

          {0,n}匹配前面的字符0次到n次

          {m,}匹配前面的字符至少m次

      3.位置锚定

          ^ 锚定行首

          $ 锚定行尾

           锚定词首和锚定词尾

          >锚定词尾

          <锚定词首

              < oot> rooter

      4.分组

          abc* abcccc  abc我们要看成一个整体

          () 示例:(abc)* abcabcabc abcccc

          **分组特性:默认情况下,Linux系统会为分组指定变量,变量的表现形式12 3....          

          示例:(ab+(xy)*) 其中1=ab+(xy)*,2=xy

原文地址:https://www.cnblogs.com/azuressy/p/11350428.html