java 不可变类型

1. java不可变性初探

我们先看下面一个例子:代码如下:


 1     import java.math.BigInteger;  
 2     public class BigProblem {  
 3         public static void main(String[ ] args) {  
 4             BigInteger fiveThousand  = new BigInteger("5000");  
 5             BigInteger fiftyThousand = new BigInteger("50000");  
 6             BigInteger fiveHundredThousand = new BigInteger("500000");  
 7             BigInteger total = BigInteger.ZERO;  
 8             total.add(fiveThousand);  
 9             total.add(fiftyThousand);  
10             total.add(fiveHundredThousand);  
11             System.out.println(total);  
12         }  
13     }


你可能会认为这个程序会打印出555000。毕竟,它将total设置为用BigInteger表示的0,然后将5,000、50,000和500,000加到了这个变量上。如果你运行该程序,你就会发现它打印的不是555000,而是0。很明显,所有这些加法对total没有产生任何影响。

对此有一个很好理由可以解释:BigInteger实例是不可变的。String、BigDecimal以及包装器类型:Integer、Long、Short、Byte、Character、Boolean、Float和Double也是如此,你不能修改它们的值。我们不能修改现有实例的值,对这些类型的操作将返回新的实例。起先,不可变类型看起来可能很不自然,但是它们具有很多胜过与其向对应的可变类型的优势。不可变类型更容易设计、实现和使用;它们出错的可能性更小,并且更加安全[EJ Item 13]。

为了在一个包含对不可变对象引用的变量上执行计算,我们需要将计算的结果赋值给该变量。这样做就会产生下面的程序,它将打印出我们所期望的555000, 代码如下:

 
 1     import java.math.BigInteger;  
 2     public class BigProblem {  
 3         public static void main(String[] args) {  
 4             BigInteger fiveThousand  = new BigInteger("5000");  
 5             BigInteger fiftyThousand = new BigInteger("50000");  
 6             BigInteger fiveHundredThousand = new BigInteger("500000");  
 7             BigInteger total = BigInteger.ZERO;  
 8             total = total.add(fiveThousand);  
 9             total = total.add(fiftyThousand);  
10             total = total.add(fiveHundredThousand);  
11             System.out.println(total);  
12         }  
13     }
View Code

2.String不可变性实现分析

根据JDK中java.lang.String的源码进行分析,从中可以得出String类型的对象不可变的原因,大致上有如下两个:
1、java.lang.String类型在实现时,其内部成员变量全部使用final来修饰,保证成员变量的引用值只能通过构造函数来修改;
2、java.lang.String类型在实现时,在外部可能修改其内部存储值的函数实现中,返回时一律构造新的String对象或者新的byte数组或者char数组;
第2的重要性在于,假如通过String类型的toCharArray方法可以直接访问String类型内部定义的char数组,那么即便String类型内部的char数组使用了final来修饰,也仅仅保证这个成员变量的引用不可变,而无法保证引用指向的内存区域不可变。由上述两点,保证外部不可能修改java.lang.String类型对象的内部属性,从而保证String对象是不可变的。
提到String,就不得不提一下JDK中存在另外两个常用来表示字符串的类,StringBuffer和StringBuilder。根据注释,StringBuffer可谓老资格了,从JDK1.0时即伴随Java征战世界,而StringBuilder直到JDK1.5时才出现。
面试时,StringBuffer和StringBuilder的区别也是常问的话题,有些没有开发经验,对多线程编码不了解、对synchronized的使用不熟悉的兄弟,很容易在这个问题上吃亏。
StringBuffer和StringBuilder的共同点:
1、都是可变对象,对象内的字符缓存会随着拼接操作而动态扩展;
2、用来完成字符串拼接操作;
3、构造时传入内部缓存大小时,可以降低缓存扩展的次数,明显提升字符串拼接操作的效率;
StringBuffer和StringBuilder的区别:
1、StringBuilder的方法都是线程不安全的,从另外一个角度讲,StringBuilder类型的对象在做字符串拼接操作时,由于少了线程同步的操作,执行效率上有很大提升;
2、StringBuffer的方法都加上了synchronized关键字,因而在一定的场景下,StringBuffer类型的对象都是线程安全的,但在执行效率上,由于多了线程同步的操作,因而会有少许的损失;
在大多数场景下,字符串拼接操作都是不需要考虑多线程环境下对结果的影响的,因而使用StringBuilder类型可以提升代码的执行效率。
在多个线程的代码中共享同一个StringBuffer类型的对象时,需要关注synchronized关键字对最终结果的影响。由于StringBuffer类的实现中,仅仅对每个方法使用了synchronized修饰,这只能保证在多线程场景下,访问StringBuffer对象的同一个方法时可以保证最终结果的一致性,假如一个线程访问A方法,另外一个线程方法B方法,则由于加锁对象的不同,可能会出现不一致的现象,这是需要程序员特别要注意的地方。类似的,可以参考Vector的实现和应用场景。

3.String不可变性的好处

最流行的Java面试题之一就是:什么是不可变对象(immutable object),不可变对象有什么好处,在什么情况下应该用,或者更具体一些,Java的String类为什么要设成immutable类型?
不可变对象,顾名思义就是创建后不可以改变的对象,典型的例子就是Java中的String类。

 代码如下:

String s = "ABC";  
s.toLowerCase();

如上s.toLowerCase()并没有改变“ABC“的值,而是创建了一个新的String类“abc”,然后将新的实例的指向变量s。

相对于可变对象,不可变对象有很多优势:
1).不可变对象可以提高String Pool的效率和安全性。如果你知道一个对象是不可变的,那么需要拷贝这个对象的内容时,就不用复制它的本身而只是复制它的地址,复制地址(通常一个指针的大小)需要很小的内存效率也很高。对于同时引用这个“ABC”的其他变量也不会造成影响。
2).不可变对象对于多线程是安全的,因为在多线程同时进行的情况下,一个可变对象的值很可能被其他进程改变,这样会造成不可预期的结果,而使用不可变对象就可以避免这种情况。
当然也有其他方面原因,但是Java把String设成immutable最大的原因应该是效率和安全。

答案二:

这是一个老生常谈的话题(This is an old yet still popular question). 在Java中将String设计成不可变的是综合考虑到各种因素的结果,想要理解这个问题,需要综合内存,同步,数据结构以及安全等方面的考虑. 在下文中,我将为各种原因做一个小结。

1. 字符串常量池的需要

字符串常量池(String pool, String intern pool, String保留池) 是Java堆内存中一个特殊的存储区域, 当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象。
如下面的代码所示,将会在堆内存中只创建一个实际String对象. 代码如下:


String s1 = "abcd";  
String s2 = "abcd";  

 

示意图如下所示:

 

假若字符串对象允许改变,那么将会导致各种逻辑错误,比如改变一个对象会影响到另一个独立对象. 严格来说,这种常量池的思想,是一种优化手段.

请思考: 假若代码如下所示,s1和s2还会指向同一个实际的String对象吗? 代码如下:


String s1= "ab" + "cd";  
String s2= "abc" + "d";  

也许这个问题违反新手的直觉, 但是考虑到现代编译器会进行常规的优化, 所以他们都会指向常量池中的同一个对象. 或者,你可以用 jd-gui 之类的工具查看一下编译后的class文件.

2. 允许String对象缓存HashCode

Java中String对象的哈希码被频繁地使用, 比如在hashMap 等容器中。

字符串不变性保证了hash码的唯一性,因此可以放心地进行缓存.这也是一种性能优化手段,意味着不必每次都去计算新的哈希码. 在String类的定义中有如下代码:代码如下:


private int hash;//用来缓存HashCode  

3. 安全性

String被许多的Java类(库)用来当做参数,例如 网络连接地址URL,文件路径path,还有反射机制所需要的String参数等, 假若String不是固定不变的,将会引起各种安全隐患。
假如有如下的代码:

boolean connect(string s){
    if (!isSecure(s)) { 
throw new SecurityException(); 
}
    // 如果在其他地方可以修改String,那么此处就会引起各种预料不到的问题/错误 
    causeProblem(s);
}

总体来说, String不可变的原因包括 设计考虑,效率优化问题,以及安全性这三大方面. 事实上,这也是Java面试中的许多 "为什么" 的答案。


答案三:String类不可变性的好处

String是所有语言中最常用的一个类。我们知道在Java中,String是不可变的、final的。Java在运行时也保存了一个字符串池(String pool),这使得String成为了一个特别的类。

String类不可变性的好处

1.只有当字符串是不可变的,字符串池才有可能实现。字符串池的实现可以在运行时节约很多heap空间,因为不同的字符串变量都指向池中的同一个字符串。但如果字符串是可变的,那么String interning将不能实现(译者注:String interning是指对不同的字符串仅仅只保存一个,即不会保存多个相同的字符串。),因为这样的话,如果变量改变了它的值,那么其它指向这个值的变量的值也会一起改变。
2.如果字符串是可变的,那么会引起很严重的安全问题。譬如,数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接,或者在socket编程中,主机名和端口都是以字符串的形式传入。因为字符串是不可变的,所以它的值是不可改变的,否则黑客们可以钻到空子,改变字符串指向的对象的值,造成安全漏洞。
3.因为字符串是不可变的,所以是多线程安全的,同一个字符串实例可以被多个线程共享。这样便不用因为线程安全问题而使用同步。字符串自己便是线程安全的。
4.类加载器要用到字符串,不可变性提供了安全性,以便正确的类被加载。譬如你想加载java.sql.Connection类,而这个值被改成了myhacked.Connection,那么会对你的数据库造成不可知的破坏。
5.因为字符串是不可变的,所以在它创建的时候hashcode就被缓存了,不需要重新计算。这就使得字符串很适合作为Map中的键,字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。
以上就是我总结的字符串不可变性的好处。

4. 例子

  1 package cn.xy.test;
  2 public class StringTest
  3 {
  4  /**
  5   * a的值在编译时就被确定下来,故其值"xy"被放入String的驻留池(驻留池在堆中)并被a指向。
  6   * b的值在编译时也被确定,那么b的值在String的驻留池中找是否有等于"xy"的值,有的话也被b指向。
  7   * 故两个对象地址一致
  8   * @return true
  9   */
 10  public static Boolean testString1()
 11  {
 12   String a = "xy";
 13   String b = "xy";
 14   return a == b;
 15  }
 16  
 17  /**
 18   * b的值在是两个常量相加,编译时也被确定。
 19   * @return true
 20   */
 21  public static Boolean testString2()
 22  {
 23   String a = "xyy";
 24   String b = "xy" + "y";
 25   return a == b;
 26  }
 27  /**
 28   * b的值为一个变量和一个常量相加,无法编译时被确定,而是会在堆里新生成一个值为"abc"的对象
 29   * @return false
 30   */
 31  public static Boolean testString3()
 32  {
 33   String a = "xyy";
 34   String b = "xy";
 35   b = b + "y";
 36   return a == b;
 37  }
 38  
 39  /**
 40   * b的值都无法编译时被确定,而是会在堆里分别新生成一个对象叫"xyy"。
 41   * @return false
 42   */
 43  public static Boolean testString4()
 44  {
 45   String a = "xyy";
 46   String b = "xy".concat("y");
 47   return a == b;
 48  }
 49  
 50  /**
 51   * new String()创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。 
 52   * a,b的值都无法编译时被确定,会在堆里分别新生成一个值为"xy"的对象。
 53   * @return fasle
 54   */
 55  public static Boolean testString5()
 56  {
 57   String a = new String("xy");
 58   String b = new String("xy");
 59   return a == b;
 60  }
 61  /**
 62   * intern()把驻留池中"xy"的引用赋给b。
 63   * @return true
 64   */
 65  public static Boolean testString6()
 66  {
 67   String a = "xy";
 68   String b = new String("xy");
 69   b = b.intern();
 70   return a == b.intern();
 71  }
 72  
 73  /**
 74   * char的toString方法返回的是一个char对象的字符串,而不是我们想象的"xy"
 75   * @return false
 76   */
 77  public static Boolean testString7()
 78  {
 79   String b = "xy";
 80   char[] a = new char[]{'x','y'};
 81   return a.toString().equals(b);
 82  }
 83  
 84 
 85  /**
 86   * char是一种新的类型,不存在驻留池的概念。
 87   * @return fasle
 88   */
 89  public static Boolean testString8()
 90  {
 91   String b = "xy";
 92   char[] a = new char[]{'x','y'};
 93   return a.toString() == b;
 94  }
 95  
 96 /**
 97   * String不可变性的体现
 98   */
 99  String str = "xy";
100  public String chage(String str)
101  {
102   str = "xyy";
103   return str;
104  }
105  
106  /**
107   * 一般引用类型的可变性(传值的时候把地址传过去,相当于把仓库的要是交给方法,方法拿到钥匙去移动仓库里的东西)
108   */
109  Person p = new Person("xy");
110  public String changePerson(Person p)
111  {
112   p.setName("xyy");
113   return p.toString();
114  }
115  public static void main(String[] args)
116  {
117   print(testString1()); // true
118   print(testString2()); // true
119   print(testString3()); // fasle
120   print(testString4()); // false
121   print(testString5()); // false
122   print(testString6()); // true
123   print(testString7()); // false
124   print(testString8()); // false
125   StringTest t = new StringTest();
126   print(t.str); // xy
127   print(t.chage(t.str)); // xxy
128   print(t.str); // xy
129   print(t.p.toString()); //xy
130   print(t.changePerson(t.p)); //xyy
131   print(t.p.toString()); //xyy
132  }
133  
134  public static void print(Object o)
135  {
136   System.out.println(o);
137  }
138 }
View Code

参考:

http://www.jb51.net/article/37889.htm

http://www.jb51.net/article/49092.htm

http://blog.csdn.net/woshixuye/article/details/8088453


  
原文地址:https://www.cnblogs.com/hf-cherish/p/4199678.html