perl的正则表达式

“小骆驼”的“正则表达式“部分学习总结:

一、匹配语法:

1、".":任意单字符(‘ ‘除外)

2、“*“:匹配前项0~n次;

3、“+“:匹配前项1~n次;

4、“?”:匹配前项0~1次;

5.1、“1"或"2“:反向引用;

5.2、“g{N}":方向引用,如果N为负数,则为相对反响引用;

6、“|”:“或“匹配(注意左边的条件可以屏蔽右边的条件)

7.1、“[]”:字符集单一字符匹配;

7.2、"[^]“:反向字符集单一字符匹配;

8.1、“d":[0-9](反向匹配:"D");“[dD]":任意字符(包括‘ ‘);

8.2、“w":[A-Za-z0-9_](反向匹配:"W");

8.3、"s":[f ](反向匹配:"S");(注意最后有空格);

8.4、"h":[ ];(匹配横向空白,注意最后有空格

8.5、"v":[f ];(匹配纵向空白)

8.6、“R":跨造作系统断行匹配;

9、"//"或“m//"或“m<>"或“m%%"等等:模式匹配;

10.1、“/i":大小写无关修饰符;

10.2、“/s":使能“."匹配' '修饰符;

10.3、“/x":忽略模式空白与注释(‘#‘后部分);

11.1、“^":行首锚位;

11.2、“$":行尾锚位;(“^s*$“:匹配任意空白行)

11.3、““:单词锚位(以‘w‘为准,方向匹配B);("ansersion"和“ansersionB"匹配:ansersiona, ansersion__ab134,但前者匹配ansersion,后者则不匹配)

12、“=~":绑定操作;

13、"($val)":使用变量;

14.1、“$1"或"$2"等等:"()"模式捕获变量;

14.2、“(?:xxx)":不捕获“xxx"之“$n"中,仅做分组;

14.3、“(?<label>xxx)":标签捕获,捕获结果位于“%+“中,引用key为“label";(方向引用“1“和"g{1}"需更改为g{label}或k<label>)(perl 5.010特性)

14.4、“ $`; $&; $' ":匹配字符串之前部分;匹配字符串部分;匹配字符串之后部分;

15、"{a}; {a,b}; {a,}":匹配a次;匹配a到b次;匹配a及a以上次;(无"{,b}",否则任意字符串会匹配成功——匹配0次)

16、"*?"; "+?"; "{a,}?", "{a,b}?":量词的“非贪婪匹配“,即通过递增索引来匹配(常规情况为“贪婪匹配“,即通过递减来匹配);

17、(?=exp);(?<=exp);(?!exp);(?<!exp):零宽断言。

二、处理语法

1、"s/a/b/":b替换首次出现的a;

2、“s/a/b/g":b替换全部的a;

3、界定符说明:“s/a/b/",“s{a}{b}",“s[a](b)",“s<a>#b#",及其它等效;

4、修饰符:"g"全局替换,"i",“x"等同“匹配语法”;"/m"多行匹配;

5、绑定操作:同“匹配语法”;

6、大写转换:U:后续字符串大写替换。"s/(a)/U$1/","s/(a)/U$1Exxx/"(“E“取消“U”对xxx影响);“u“单一字符大写替换:s/(a)/uL$1/ig(首字母大写);

7、小写转换:L;l同“大写转换“;

8、字符串分割(split):@fields = split /separator/, $string;

9、字符串拼接(join):my $result = join $glue, @pieces;(@pieces必须含2个或2个以上元素)

三、其他

1、优先级:

2、测试程序:

#!/usr/bin/perl

while(<>) {
         chomp;
          if(/YOUR_PATTERN_GOES_HERE/) {
                 print "Matched: |$`<$&>$'| ";
          } else {
                 print "No match: |$_| ";
         }
 }
 

3、常用字符串匹配与处理:

(1)提取字符串字母部分:

my @words = ($text =~ /([a-z]+/g);

my $result = join "", @words;

(2)提取记录hash:

my %students = ($text =~ /(?<ID>w+)s+(?<Name>w+)/g);

原文地址:https://www.cnblogs.com/ansersion/p/4248267.html