正则表达式

正则表达式非常强大，学好不易，需要经常用。

上面介绍的元字符，可以看到查找数字、字母或数字、空格是很简单的因为有了对应的这些字符的集合，但是，如果想匹配a b c d e中任意一个字符，这就自定义字符集合。

满足几种匹配规则，则可以使用'|'把不同规则分开。例如带区号的电话(可能7位，可能8位)：010-66887144，使用分支条件：0d{2}-d{8}|0d{2}-d{7}

例如想匹配IP地址，单纯((d{1,3}).){3}d{1,3}，会出现匹配到333.444.555.111这种不存在的ip，这时候就需要用到分组。下面给出完整IP地址分组表达式

IP表达式：((25[0-5]|2[0-4]d|[0-1]d{2}|[1-9]?d).){3}((((25[0-5]|2[0-4]d|[0-1]d{2}|[1-9]?d))。

正则表达式可以包含注释进行解析说明，通过语法(?#comment)来实现，例如w+(?#字符串)。要包含注释的话，最好的是启用"忽略模式里的空白符"选项，这样在编写表达式时任意添加空格、Tab、换行、而实际使用这些都将被忽略。

当正则表达式包含能接受重复的限定符时，通常的行为是（在使整个表达式能得到匹配的前提下）匹配尽可能多的字符，这就是贪婪模式。以表达式aw+b为例，如果搜索a12b34b,会尽可能匹配更多的个数，最后就会匹配整个a12b34b，而不是a12b。但是如果想匹配出a12怎么办？这就需要懒惰模式，尽可能匹配个数较少的情况，因此需要改写成：aw+?b，使用？启动懒惰模式。

名称	说明
IgnoreCase(忽略大小写)	匹配时不区分大小写。
Multiline(多行模式)	更改^和$的含义，使它们分别在任意一行的行首和行尾匹配，而不仅仅在整个字符串的开头和结尾匹配。(在此模式下,$的精确含意是:匹配之前的位置以及字符串结束前的位置.)
Singleline(单行模式)	更改.的含义，使它与每一个字符匹配（包括换行符）。
IgnorePatternWhitespace(忽略空白)	忽略表达式中的非转义空白并启用由#标记的注释。
ExplicitCapture(显式捕获)	仅捕获已被显式命名的组。