正则表达式——去除文本中的非汉字（VB2005）

　　本人由于工作关系，需要一段代码，将给定的字符串中的非汉字去除，只保留汉字部分。

　　这个一般用正则表达式比较简单，网上有一些匹配汉字的正则表达式，拿来经过改造就能实现我前面的要求。

　　注释一下，正则表达式[\u4e00-\u9fa5]表示匹配中文，则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串，也就是去除了文本中的非中文字符。

　　代码格式修正于2012年1月5日

Imports System.Text.RegularExpressions
Public Class clsT
　　Public Function OnlyChinese(ByVal mText As String) As String
　　　　Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
　　End Function
End Class

作者：万仓一黍

出处：http://grenet.cnblogs.com/

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。