Java 正则表达式 Pattern & Matcher

  通常会有这种需求: 在文档中搜索有规律的字符串,然后进行统计或者替换。Java.util.regex包下的Pattern和Matcher这两个类提供了通过正则表达式来匹配查询,甚至替换的功能。那么我们接下来就举个栗子吧 : 

栗子1:查找文件中以img_数字.png格式的字符串,并在前面添加路径: /test/img/ 

package test;

import java.io.File;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.io.FileUtils;

public class PatternTest {

	private static final String CONSTSTRING = "<a><img src='img_01.png'/></a>";
	public static void main(String[] args) throws Exception {
		File file = new File("C:\Users\Admin\Desktop\test.txt");
		FileUtils.writeStringToFile(file, CONSTSTRING);
		String str = FileUtils.readFileToString(file, "UTF-8");
		StringBuffer stringBuffer = new StringBuffer();
		//设置Pattern的正则表达式
		Pattern p = Pattern.compile("img_[0-9]+\u002png");
		//按规则匹配
		Matcher m = p.matcher(str);
		while(m.find()){
			//将匹配到并替换后的字符串以及前面的字符串添加到StringBuffer中
			m.appendReplacement(stringBuffer, "/test/img/"+m.group());
			System.out.println(stringBuffer.toString());
			System.out.println();
		}
		//将匹配到的字符串之后的字符串添加到StringBuffer中
		m.appendTail(stringBuffer);
		FileUtils.writeStringToFile(file, stringBuffer.toString(), "UTF-8");
	}
}

  其实这个问题有个简单方法,这里扩展一下 : 

package test;

import java.io.File;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.io.FileUtils;

public class PatternTest {

    private static final String CONSTSTRING = "<a><img src='img_01.png'/></a>";
    public static void main(String[] args) throws Exception {
        File file = new File("C:\Users\JD07201\Desktop\test.txt");
        FileUtils.writeStringToFile(file, CONSTSTRING);
        String str = FileUtils.readFileToString(file, "UTF-8");
        str = str.replace("img_", "/test/img/"+"img_");
        FileUtils.writeStringToFile(file, str, "UTF-8");
    }
}

  这个方法的前提是匹配条件必须只能映射到目标字符串,在这里就是指匹配条件"img_"必须等价于 "img_[0-9]+\u002png",否则就有可能将不符合条件的字符串也给替换了。

  

原文地址:https://www.cnblogs.com/djoel/p/5645846.html