java split

Java中的 split  函数是用于按指定字符(串)或正则去分割某个字符串,结果以字符串数组形式返回;

例如:

[java] view plaincopy
 
  1. String str="1234@abc";  
  2. String[] a = str.split("@");  
  3. System.out.println("处理结果: "+a[0]+","+a[1]);   //输出的是: 处理结果: 1234,abc  


对于分割的字符(串),通常是常见,普通的,没什么问题;

但是对某些特殊字符,如果字符(串)正好是正则的一部分,则需要转义才能使用,

这些字符有 | , + , * , ^ , $ , / , | , [ , ] , ( , ) , - , . , 等, 因它们是正则表达式中的一部分, 所以如果想用该字符本身, 这些字符需要进行转义才能表示它本身;

例如: 

想用 | 竖线去分割某字符,因 | 本身是正则表达式中的一部分,所以需要 去转义,因转义使用 \, 而这个 正好也是正则表达式的字符,所以还得用一个 , 所以需要两个 \。

[java] view plaincopy
 
  1. String str="5678|XYZ";  
  2. String[] b = str.split("\|");  //注意这里用两个 \,而不是一个  
  3. System.out.println("处理结果: "+b[0]+","+b[1]);   //输出的是: 处理结果: 5678,XYZ  

再来看看:

[java] view plaincopy
 
  1. String str="5678|XYZ";  
  2. String[] b = str.split("|");  //注意直接使用|,该字符是正则表达式的一部分,  
  3. String x="处理结果: ";  
  4. for(int i=0;i<b.length;i++){  
  5.     x=x+b[i]+",";  
  6. }  
  7. System.out.println(x);   //输出的是: 处理结果: 5,6,7,8,|,X,Y,Z,  


可能我们人为主观感觉是用 | 来分割希望得到 5678 和 XYZ,因用特殊字符,实际结果是得到意外的结果;

今天下午就这个地方耗了几个小时,头晕才发现问题所在,555....

所以指定分割的字符(串)时,最好不要包含用于正则表达式本身的字符,如上面的红色字符;

原文地址:https://www.cnblogs.com/vn2019/p/4988392.html