浅析Java String

  • String 特性

    1.其定义的字符串序列不可变。

    2.是一个final类,不可被继承,且其内部一些重要方法被定义为final类型,不可重写。

    3.内部实现Serializable接口(支持字符串序列化)和Comparable接口(支持字符串比较大小)。

    4.内部定义了final char [ ] value 用于存储字符串数据。


  • String的实例化方式

1.字面量赋值的形式实例化:
	String str1 = "abc"
2.用 new  +  构造器形式实例化:
	String str2 = new String("abc") 	

下面来分析一下两种不同实例化方式的区别:

​ 当我们执行System.out.println(s1 == s2);的时候,输出结果为``false`,

​ 而执行System.out.println(s1.equals(s2));的时候,输出结果为true,

​ 这和虚拟机的内存分配有关:

​ 对于str1字面量赋值的形式来说,字符串常量是存放在常量池中。而对于str2的构造器赋值形式,堆中的value存放的是new String("abc")对象本身,而str2是栈中开辟的一个内存块,他里面存放了指向对象本身的引用地址。有一点需要知道,在常量池中存放的东西都是唯一的,不会出现两个相同的内容,这也是为了减少内存开销和提升jvm的性能优化,所以在使用str2 的时候,对象本身又会到常量池中找是否有abc,如果没有则创建新的,如果有,则直接使用。

​ 在之前的文章中也探究过==equals的区别,当用==比较的时候,对于基本数据类型,比较的是内容,值是否相等。而对于刚刚的str1和str2,他们都是引用型数据类型,用==比较的时候,比较的是地址,很明显,str1的地址直接指向常量池中的abc,而str2 的地址是指向堆内存中的实例对象,所以==比较肯定是false,而用equals比较的时候,结果为true,这是因为String类对object类的equals方法进行了重写,object类中的equals方法底层用的还是==来判断地址值。

总结区别

​ 1.字面量赋值的形式实例化,字符常量内容存于常量池,变量存于栈中,直接指向常量池。

​ 2.new + 构造器形式实例化,会先在堆中创建实例对象,引用对象存于栈中,然后再去常量 区寻找需要的字符常量,如果找到了,直接使用,没找到则开辟新的空间并存储内容。


  • String的不可变性

    我们都知道String是不可变的序列,那为什么不可变,又是怎么实现的呢?先来看一段源码:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0

    /** use serialVersionUID from JDK 1.0.2 for interoperability */
    private static final long serialVersionUID = -6849794470754667710L;

    private static final ObjectStreamField[] serialPersistentFields =
        new ObjectStreamField[0];

​ 可以看出,String是一个final类,也就意味着他不可以被继承,而且其内部成员变量是private修饰,方法也是final修饰,同样也就意味着他的成员变量不会直接暴露给用户,方法不可以被重写。这样实现了方法不可变(不能重写),变量不能变,比如private final char value[];这里就是string字符串不能变的实现。

字符串不可变底层实现分析:

​ 当运行如下代码的时候:

String s1 = "Java";
String s2 = "Hello";
String s5 = s1;
s5 = "change";
String s3 = new String("Hello");
String s4 = new String("Java");

​ 字符串常量在虚拟机内存空间的情况如图所示:

​ 可见,对于String s1 = "Java"这种字面量赋值的形式,会直接在常量池中开辟一个空间用于存储相应的字符串(前提是常量池中还没有该字符串),而String s3 = new String("Hello")这样的,会先在堆中创建对象,然后再去常量池中找是否有需要的字符常量,如果有,则直接使用,如果没有,也同样需要开辟新的空间来存储。

重点看 :

String s1 = "Java";
String s5 = s1;
s5 = "change";

​ 当执行String s5 = s1时,s5会直接去使用s1在常量池中的内容,而后面当执行s5 = "change"的时候,也就是说需要对Java这个字符串进行修改,可是这个字符串除了s5自己使用外,s1也在使用,所以就不能直接修改他,而是要在空间中重新开辟一个空间,用于存储change。这就是字符串不可以直接修改的底层实现!

字符串设置为不可变的原因:

​ ①出于安全考虑,程序在运行之前虚拟机会把字符常量,静态变量等预加载到常量池(方法区) 中存储起来,在程序运行的时候直接调用,但是常量池里面的信息不会有重复的,每一个都是 唯一的(这样是为了减少内存的开销,提升性能),这些信息是线程共享的,同一个字符串可 能会被多个线程使用,如果字符串可变,当某个线程修对他做了修改,其他正在使用该字符串 的线程可能就会出现严重的错误,从而变得不安全。

​ ②保证hash值不会经常变动,具有唯一性,使得类似HashMap的容器能实现key—value的功能


  • String 字符串的拼接

    	static String s1 = "Hello";
    	static String s2 = "Java";
    	static String s3 = "Hello"+"Java";
    	static String s4 = "HelloJava";
    	static String s5 = s1 + "Java";
    	static String s6 = "Hello" + s2;
    	static String s7 = s1 + s2;
    	static String s8 = (s1 + s2).intern();
    

    内存分配如图:

字符串拼接总结:

​ 1.常量和常量的拼接,结果也在常量池中,且不存在两个相同的常量。

​ 2.只要参与拼接的项里面有变量,结果就在堆中。

​ 3.使用(String).inter()方法处理拼接后,被处理的字符串会进入常量池中。


  • 说在最后

    文章仅是笔者的个人理解,难免存在许多不完善和理解不恰当之处,欢迎批评指正。

    码字不易,创作辛苦,欢迎转载分享,请注明出处。

    交流欢迎Q我:321662487

原文地址:https://www.cnblogs.com/coding-996/p/12009700.html