Remove all the html Tag in String

在用Umbraco开发项目的过程中,由于在Umbraco Back office 中有用到 rich text editor, 而它返回的值是HtmlString类型,也就是说是包含Html Tag的

比如 返回的是 "<p><span>This is a test message</span></p>"

那么,如何来移除掉其中的html tag呢.

我们可以用正则表达式来移除掉其中的html tag

@using System.Text;
@using System.Web;

public static class StringTool
{
    
   private static readonly Regex HtmlTag = new Regex(@"<[^>]*>"); 

   public static string RemoveHtmlTag(this string origStr)  
   {
     return string.IsNullOrEmpty(origStr) ? origStr : HttpUtility.HtmlDecode(HtmlTag.Replace(origStr, string.Empty));
   }  

}

上面,我们写了一个扩展方法 RemoveHtmlTag 来移除string中的html tag, 采用了正则表达式HtmlTag

原文地址:https://www.cnblogs.com/wphl-27/p/9672467.html