正则表达式(正声明、负声明、反向正声明、反向负声明)

正声明:(?=EXP),括号中的模式必须出现在声明右侧,但不作为匹配的一部分
负声明:(?!EXP),括号中的模式必须不出现在声明右侧

var x = "1024used2048free";
var r1 = new Regex(@"d{4}(?=used)");
if (r1.Matches(x).Count==1)
{
    Console.WriteLine("r1 match:" + r1.Match(x).Value);
    //输出:1024
}

var r2 = new Regex(@"d{4}(?!used)");
if (r2.Matches(x).Count==1)
{
    Console.WriteLine("r2 match:" + r2.Match(x).Value); 
    //输出:2048
}

反向正声明:(?<=EXP),括号中的模式必须出现在声明左侧,但不作为匹配的一部分
反向负声明:(?<!EXP),括号中的模式必须不出现在声明左侧

string x = "used:1024 free:2048";
Regex r1 = new Regex(@"(?<=used:)d{4}");
if (r1.Matches(x).Count==1)
{
    Console.WriteLine("r1 match:" + r1.Match(x).Value);
//输出:1024 }
Regex r2
= new Regex(@"(?<!used:)d{4}"); if (r2.Matches(x).Count==1) { Console.WriteLine("r2 match:" + r2.Match(x).Value);
//输出:2048 }

非回溯匹配:(?)
涵义:该组匹配后,其匹配的字符不能通过回溯用于后面的表达式的匹配。呵呵,光看这句话肯定搞不懂,我当初为了搞懂这个也花了不少的时间,还是通过实例来说明吧:
"www.csdn.net" 可以通过@"w+.(.*).w+"来匹配,却不能通过@"w+.(?>.*).w+"来匹配!为什么呢?

  原因是正则匹配是贪婪的,匹配时它会尽可能多的匹配最多的结果,所以,上例两个正则式中的.*都会把csdn.net匹配完, 这个时候,第一个表达式在开始匹配时发现.w+没得字符给它匹配了,所以它会进行回溯,所谓回溯,就是把.*匹配的结果往回推,回推留出来的字符再用来匹配.w+,直到.w+匹配成功,整个表达式返回成功的匹配结果。而第二个表达式,因使用的是非回溯匹配,所以,.*匹配完后,不允许通过回溯来匹配.w+,所以整个表达式匹配失败。

  请注意,回溯匹配是很浪费资源的一种匹配方式,所以,请尽量避免您的正则式要通过回溯来成功匹配,如上例,可以换成@"w+.([^.]+.)+w+"+"。

 

原文地址:https://www.cnblogs.com/mrhgw/p/6594182.html