Java对于成对括号的提取

在工作的项目当中,经运营人员的反馈,发现提供服务的指定属性字段的值为空,导致搜索引擎无法正常搜索到正确的结果。

原始的字符串提取程序为:

// 只取对应符号分割的第一部分
name.split("_|\(|(")[0].trim();

因此对于"(*)*"之类的字符串,则会提取为相应的空值,所以做了如下优化,提取成对括号中的内容及括号外的内容:

// 提取成对括号内的字符串
public static String extractBracketInnerStr(String str) {
        if(!str.contains("(") || !str.contains(")")){
            return "";
        }
        List<String> result = Lists.newArrayList();
        int m = 0, n = 0, count = 0;
        for(int i = 0; i < str.length(); i++){
            if(str.charAt(i) == '('){
                if(count == 0) m = i;
                count ++;
            }

            if(str.charAt(i) == ')'){
                count--;
                if (count == 0) {
                    n = i;
                    result.add(str.substring(m+1,n).trim());
                }
            }
        }

        // 检验括号是否配对
        if(count != 0){
            return "";
        }
        return StringUtils.join(" ",result);
    }

    // 提取成对括号外的字符串
    public static String extractBracketOuterStr(String str) {
        if(!str.contains("(") || !str.contains(")")){
            return str;
        }
        List<String> result = Lists.newArrayList();
        int m = 0,n = 0, count = 0;
        for(int i = 0; i < str.length(); i++){
            if(str.charAt(i) == '('){
                if(count == 0) {
                    m = i;
                    result.add(str.substring(n,m).trim());
                }
                count ++;
            }

            if(str.charAt(i) == ')'){
                count--;
                if (count == 0) {
                    n = i+1;
                }
            }
        }

        if(n < str.length()){
            result.add(str.substring(n));
        }

        // 检验括号是否配对
        if(count != 0){
            return str;
        }

        return StringUtils.join(" ",result);
    }
原文地址:https://www.cnblogs.com/mengrennwpu/p/6472024.html