提取文本当中的汉字

http://tool.chinaz.com/regex/

[u4e00-u9fa5]+s*[,!?:]*[u4e00-u9fa5]+[,!?:]*

tool.chinaz>切额地方地,方!<.com|ddd//大声夺地d在在地  方!:88

[u4e00-u9fa5] : 表示一下汉字

+ 重复限定词: [1, 无限]

s : 空格

*: 重复限定词:[0,无限](表达可能有空格,也可能没有空格)

[,!?:] * : 可能出现此类标点符号,也可能没有

[u4e00-u9fa5]+ 必须至少出现一人汉字

[,!?:]* 可能出现此类标点符号,也要吧没有

原则:

正则表达式当中每一个元素只代表一个字符的含义:

如[u4e00-u9fa5] 只表示只要是这个集合就OK

如果想表达多个 : 限定词 *, +

原文地址:https://www.cnblogs.com/pengxinglove/p/5181151.html