PHP正则反斜杠的讲究

今天看了一篇文章说下自己的理解

文章地址:https://www.t00ls.net/articles-55906.html

先看一段代码,看起来很正常,但是实际上这段代码会报错!

if(preg_match("#\\|\#i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

它会报错,报错的信息是 结束分隔符 不存在,这里指的 结束分隔符 实际上在PHP正则中就是 定界符 !

再看这段,只是前后换了下位置 发现就不会报错了!

if(preg_match("#\|\\#i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

那么问题肯定出现在\上,我们对 $cmd 进行传数据来匹配

$cmd => 单个反斜杠 结果 无匹配

$cmd => \ 两个反斜杠 结果 无匹配

发现结果都不匹配!

那么来看看 \ 的问题所在,其实这里正则中的\ 的解析流程是这样的:

1、 \ 先经过PHP正则解析器为一个

2、 又跟'|'结合到一起,从而在 正则表达式的解析器解析为|

3、又因为'|'是正则中的保留符号,所以需要一个转义符来转义,所以\|这个的结果就是匹配 '|'

4、后面又跟了\\,这里 先经过PHP正则解析器为 \,然后在经过 正则表达式的解析器为 ''

5、那么最后的正则表达式就是匹配| 这两个符号!

那么也就可以理解上面的那个为什么会报错了,因为结果就是匹配#,所以我们还需要加个 定界符#,来进行修复

if(preg_match("#\\|\##i",$cmd,$match)){
    var_dump($match);
    echo ("forbid~");
}

这样就不会报错了!

然后看了下面的评论酒馆师傅说代码审计中存在,以后在代码中也需要多多关注!

原文地址:https://www.cnblogs.com/zpchcbd/p/12687117.html