利用正则表达式来替换文本,可以最大程序的灵活替换或删除文本内容。

首先要学会使用正则表达式

关于替换文本的最主要的功能就是 对正则表达式类的学习

学习正则表达式,推荐 下面这个网址(30分钟 学会正则表达式)

http://deerchao.net/tutorials/regex/regex.htm

在程序中引用 using System.Text.RegularExpressions;

在程序中使用  Regex.Replace  来完成文本替换工作

Regex  是正则表达式类。来源于上面那个引用

Regex.Replace(要替换的原始文本,正则表达式内容,替换后的内容,选项)

选项有  RegexOptions  来指定。

举个例子

using System.Text.RegularExpressions;

        public static string ReplaceText(string text, string search, string replace)
        {
            return Regex.Replace(text, search, replace, RegexOptions.Singleline);
        }

这是一个替换文本的函数

使用方法

using System.IO;  //这里的 File 类是在这个空间里引用的。

string text = File.ReadAllText(filename, Encoding.GetEncoding("gb2312"));

text = ReplaceText(text, "<span.*?>", "");

将 以<span开始 以 > 结尾 中间有不限数量个任意字符(由于设定 RegexOptions.Singleline)所以,任意字符中也包括换行符回车符\n

具体的含义:请参考正则表达式教程。

File.WriteAllText(newfilename, text, Encoding.GetEncoding("gb2312"));

原文地址:https://www.cnblogs.com/lujin49/p/2124380.html