java 去html标签,去除字符串中的空格,回车,换行符,制表符

  public static String getonerow(String allLine,String myfind)
    {
           
              Pattern pattern = Pattern.compile("<div class="row">.*?</div>");        
             Matcher  matcher = pattern.matcher(allLine);
            while(matcher.find()) {
                String  myval = matcher.group();
                int npos=myval.indexOf(myfind);
                if(npos>=0)
                {
                    npos = myval.indexOf("<span class="cell value">");
                    if(npos>0)
                    {
                         String content = myval.substring(npos,myval.length());
                         content=content.replaceAll("</?[^>]+>","");   //剔出了<html>的标签
                         content=content.replace("&nbsp;","");
                         content=content.replace(".","");
                         content=content.replace(""","‘");
                         content=content.replace("'","‘");
                         content=content.replaceAll("\s*| | | ","");//去除字符串中的空格,回车,换行符,制表符
                         return content;
                    }
                }
            }
            return "";
   
    }

原文地址:https://www.cnblogs.com/zheh/p/3904180.html