C#中使用正则表达式来过滤html字符

在C#中可以使用正则表达式来过滤html字符，比如，在验证用户输入时，为了保证安全性，就需要过滤html字符。

using System.Text.RegularExpressions;

Regex.Replace(htmlcode ,"<[^>]+>","");

解释一下：< 代表以 "< "开头

[^>] 其中[^...] 就是匹配任何字符，但不许匹配^之后紧跟的字符，也就是如果"<>" 出现在字符串中，是不会去过滤的，因为它部属于html标记.

然后就是那个 + 号，加号的意思就是匹配前面的至少一个搜索项

最后是 >，表示html标记以>结尾。

作者：Tyler Ning
出处：http://www.cnblogs.com/tylerdonet/
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，如有问题，请微信联系冬天里的一把火