perl的正则表达式

“小骆驼”的“正则表达式“部分学习总结：

一、匹配语法：

1、"."：任意单字符（‘ ‘除外）；

2、“*“：匹配前项0～n次；

3、“+“：匹配前项1～n次；

4、“?”：匹配前项0～1次；

5.1、“1"或"2“：反向引用；

5.2、“g{N}"：方向引用，如果N为负数，则为相对反响引用；

6、“|”：“或“匹配（注意左边的条件可以屏蔽右边的条件）；

7.1、“[]”：字符集单一字符匹配；

7.2、"[^]“：反向字符集单一字符匹配；

8.1、“d"：[0-9]（反向匹配："D"）；“[dD]"：任意字符（包括‘ ‘）；

8.2、“w"：[A-Za-z0-9_]（反向匹配："W"）；

8.3、"s"：[f ]（反向匹配："S"）；(注意最后有空格)；

8.4、"h"：[ ]；（匹配横向空白，注意最后有空格）

8.5、"v"：[f ]；（匹配纵向空白）

8.6、“R"：跨造作系统断行匹配；

9、"//"或“m//"或“m<>"或“m%%"等等：模式匹配；

10.1、“/i"：大小写无关修饰符；

10.2、“/s"：使能“."匹配' '修饰符；

10.3、“/x"：忽略模式空白与注释（‘#‘后部分）；

11.1、“^"：行首锚位；

11.2、“$"：行尾锚位；（“^s*$“：匹配任意空白行）

11.3、““：单词锚位（以‘w‘为准，方向匹配B）；("ansersion"和“ansersionB"匹配：ansersiona, ansersion__ab134，但前者匹配ansersion，后者则不匹配)

12、“=~"：绑定操作；

13、"($val)"：使用变量；

14.1、“$1"或"$2"等等："()"模式捕获变量；

14.2、“(?:xxx)"：不捕获“xxx"之“$n"中，仅做分组；

14.3、“(?<label>xxx)"：标签捕获，捕获结果位于“%+“中，引用key为“label"；（方向引用“1“和"g{1}"需更改为g{label}或k<label>）（perl 5.010特性）

14.4、“ $`; $&; $' "：匹配字符串之前部分；匹配字符串部分；匹配字符串之后部分；

15、"{a}; {a,b}; {a,}"：匹配a次；匹配a到b次；匹配a及a以上次；（无"{,b}"，否则任意字符串会匹配成功——匹配0次）

16、"*?"; "+?"; "{a,}?", "{a,b}?"：量词的“非贪婪匹配“，即通过递增索引来匹配（常规情况为“贪婪匹配“，即通过递减来匹配）；

17、(?=exp);(?<=exp);(?!exp);(?<!exp)：零宽断言。

二、处理语法

1、"s/a/b/"：b替换首次出现的a；

2、“s/a/b/g"：b替换全部的a；

3、界定符说明：“s/a/b/"，“s{a}{b}"，“s[a](b)"，“s<a>#b#"，及其它等效；

4、修饰符："g"全局替换，"i"，“x"等同“匹配语法”；"/m"多行匹配；

5、绑定操作：同“匹配语法”；

6、大写转换：U：后续字符串大写替换。"s/(a)/U$1/"，"s/(a)/U$1Exxx/"（“E“取消“U”对xxx影响）；“u“单一字符大写替换：s/(a)/uL$1/ig（首字母大写）；

7、小写转换：L；l同“大写转换“；

8、字符串分割(split)：@fields = split /separator/, $string；

9、字符串拼接(join)：my $result = join $glue, @pieces；（@pieces必须含2个或2个以上元素）

三、其他

1、优先级：

2、测试程序：

#!/usr/bin/perl

while(<>) {
         chomp;
          if(/YOUR_PATTERN_GOES_HERE/) {
                 print "Matched: |$`<$&>$'| ";
          } else {
                 print "No match: |$_| ";
         }
}

3、常用字符串匹配与处理：

（1）提取字符串字母部分：

my @words = ($text =~ /([a-z]+/g);

my $result = join "", @words;

（2）提取记录hash：

my %students = ($text =~ /(?<ID>w+)s+(?<Name>w+)/g);