可遇不可求的Question之过滤单词字符的正则表达式\w的疑义

我想大多数的教材上都写着这样的解释。

\w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。

但是实际上以下两种正则表达式的效果实际上是不相同的。

\w                   匹配包括下划线的任何单词字符。包括'[A-Za-z0-9_]' 以及所有语言中的单词,比如 汉字 日文单词 韩语 等等。

[A-Za-z0-9_]   只匹配 [A-Z],[a-z],[0-9] 以及下划线_

大家可以试一试。

很容易混淆哦。感叹一句,尽信书不如无书!

原文地址:https://www.cnblogs.com/tigerjacky/p/1841373.html