中文字符和中文标点符号的正则表达式

匹配中文标点符号: [u3002uff1buff0cuff1au201cu201duff08uff09u3001uff1fu300au300b] 该表达式可以识别出: 。 ; , : “ ”( ) 、 ? 《 》 这些标点符号。

w匹配的仅仅是中文,数字,字母

匹配中文字符的正则表达式: [u4e00-u9fa5]

匹配双字节字符(包括汉字在内):[^x00-xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

在线统计字符创长度:https://www.sojson.com/convert/zishutongji.html

原文地址:https://www.cnblogs.com/hycms/p/11097924.html