HTML格式化为标准XML

第三方
SgmlReaderDll  

/// <summary>

        /// 把html转成XML
        /// </summary>
        /// <param name="html"></param>
        /// <returns></returns>
        private static XElement Html2XML(string html)
        {
            Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader();

            sgmlReader.DocType = "HTML";
            sgmlReader.WhitespaceHandling = WhitespaceHandling.All;
            sgmlReader.CaseFolding = Sgml.CaseFolding.ToLower;
            sgmlReader.InputStream = new StringReader(html);
            return XElement.Load(sgmlReader);
        }           


QQ群:1022985150 VX:kklldog 一起探讨学习.NET技术
作者:Agile.Zhou(kklldog)
出处:http://www.cnblogs.com/kklldog/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

原文地址:https://www.cnblogs.com/kklldog/p/2130980.html