1、以主流的JDK版本1.8来说,String内部实际存储结构为char数组,源码如下:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence {
// 用于存储字符串的值
private final char value[];
// 缓存字符串的 hash code
private int hash; // Default to 0
// ......其他内容
}
1)多构造方法
String字符串有以下4个重要的构造方法:
// String 为参数的构造方法
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
// char[] 为参数构造方法
public String(char value[]) {
this.value = Arrays.copyOf(value, value.length);
}
// StringBuffer 为参数的构造方法
public String(StringBuffer buffer) {
synchronized(buffer) {
this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
}
}
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
this.value = Arrays.copyOf(builder.getValue(), builder.length());
}
notes:其中比较被我们忽略的是以StringBuffer和StringBuilder为参数的构造函数,因为这三种数据类型,我们通常都是单独使用的
所以这个小细节我们需要特别留意一下
2)equals()比较两个字符串相等
需查看的源码如下:
public boolean equals(Object anObject) {
// 对象引用相同直接返回 true
if (this == anObject) {
return true;
}
// 判断需要对比的值是否为 String 类型,如果不是则直接返回 false
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
// 把两个字符串都转换为 char 数组对比
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
// 循环比对两个字符串的每一个字符
while (n-- != 0) {
// 如果其中有一个字符不相等就 true false,否则继续对比
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
notes:String类型重写了object的equals()方法,equals()方法需要传递一个object类型的参数值,在比较的时候需要先通过instantof判断是否为String类型,如果不是则会直接返回false
instantof的使用如下:
Object oString = "123";
Object oInt = 123;
System.out.println(oString instanceof String); // 返回 true
System.out.println(oInt instanceof String); // 返回 false
notes:当判断参数为String类型之后,会循环对比两个字符串中的每一个字符,当所有字符都相等时返回true,否则返回false
还有一个和equals()比较类似的方法equalsIgnoreCase(),它是用于忽略字符串的大小写之后进行字符串对比
3)compareTo()比较两个字符串
compareTo()方法用于比较两个字符串,返回的结果为int类型的值,源码如下:
public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
// 获取到两个字符串长度最短的那个 int 值
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value;
int k = 0;
// 对比每一个字符
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
// 有字符不相等就返回差值
return c1 - c2;
}
k++;
}
return len1 - len2;
}
notes从源码中可以看出,compareTo()方法会循环对比所有的字符,当两个字符串中有任意一个字符不同时,则return char1-char2。
比如,两个字符串分别存储的是1和2,返回的值是-1;如果存储的是1和1,则返回的值是0,如果存储的是2和1,则返回的值是1
当然,还有一个和compareTo()比较类似的方法compareToIgnoreCase(),用于忽略大小写后比较两个字符串
*****综上compareTo()方法和equals()方法都是用于比较两个字符串的,但却有不同特点;
①equals() 可以接收一个 Object 类型的参数,而 compareTo() 只能接收一个 String 类型的参数;
②equals() 返回值为 Boolean,而 compareTo() 的返回值则为 int。
它们都可以用于两个字符串的比较,当 equals() 方法返回 true 时,或者是 compareTo() 方法返回 0 时,则表示两个字符串完全相同。
4)其它重要方法
indexOf():查询字符串首次出现的下标位置
lastIndexOf():查询字符串最后出现的下标位置
contains():查询字符串中是否包含另一个字符串
toLowerCase():把字符串全部转换成小写
toUpperCase():把字符串全部转换成大写
length():查询字符串的长度
trim():去掉字符串首尾空格
replace():替换字符串中的某些字符
split():把字符串分割并返回字符串数组
join():把字符串数组转为字符串
知识拓展:
1、==和equals的区别
==对于基本数据类型来说,是用于比较"值"是否相等的,而对于引用类型来说,是用于比较引用地址是否相同的
查看源码会发现Object中也有equals()方法:
public boolean equals(Object obj){
return (this == obj);
}
notes:可以看出Object中equals()方法其实就是==,而String重写了equals()方法把它修改成比较两个字符串的值是否相等
让我们来看源码:
public boolean equals(Object anObject) {
// 对象引用相同直接返回 true
if (this == anObject) {
return true;
}
// 判断需要对比的值是否为 String 类型,如果不是则直接返回 false
if (anObject instanceof String) {
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
// 把两个字符串都转换为 char 数组对比
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
// 循环比对两个字符串的每一个字符
while (n-- != 0) {
// 如果其中有一个字符不相等就 true false,否则继续对比
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
2、final修饰的好处
从String类的源码我们可以看出String是被final修饰的不可继承类
其实这样做的好处有两个原因:安全和高效
安全:比如在调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,在校验过后,它的内部值就会发生改变,这样有可能会·引起严重的系统崩溃问题,因此将String设计成一个不可变类
高效:以JVM中的字符串常量池来举例
如:String s1 = "java";
String s2 = "java";
只有字符串是不可变的,我们才能实现字符串常量池,字符串常量池可以为我们缓存字符串,提高程序的运行效率
试想一下如果 String 是可变的,那当 s1 的值修改之后,s2 的值也跟着改变了,这样就和我们预期的结果不相符了,因此也就没有办法实现字符串常量池的功能了。