Java 程序内存分析

转自：http://www.iteye.com/topic/528230

java程序内存主要分为了2个部分，包括stack segment(栈内存区)、heap segment(堆内存区)。

在分析Java程序内存分配情况时，我们从下面这个经常被使用的例子开始吧。

下面程序将打印什么呢？

String s1 = new String("abc");
String s2 = new String("abc");
System.out.print(s1.equals(s2)); // 1
System.out.print(s1 == s2); // 2

可能大家心中已经有答案了，第1条语句打印的是true，第二条语句打印的false，没错，正如大家所想，打印结果就是这样。那么，大家是否知道为什么第2条语句打印的是false呢？

让我们来看看这个程序中的数据在内存中分配的情况吧。

首先，我们分析第一条语句String s1=new String("abc");
其实这条语句是下面两条语句的缩写，
String s1; //1
s1=new String("abc"); //2

1. 在栈内存中定义一个名为s1的对String类的对像引用变量
2. 在堆内存开辟了一块空间用于存放字符串“abc”，将1定义的引用变量s1指向该空间。
同理，第二条语句String s2=new String("abc");也做了同样的事情，定义引用变量，指向新开辟出来的空间。说到这里大家可能心中已经有答案了，为什么s1!=s2呢？因为它们指向的是两块不同的堆内存空间。

其实，在java中new过程分配内存情况都和上面类似，先在栈内存中定义引用，然后在堆内存中开辟空间，存放数据，最后让引用指向该空间，如果一个引用没有指向任何空间，那么在使用这个引用变量时，程序将抛出著名的NullPointerException，其实从这个异常名字我们也能清晰知道产生该异常的原因，不是吗？

======================================================

熟悉了上面这个例子，基本上大家对Java程序内存分配情况，已经入门了，让我们进入下一步吧。
我们定义下面的一个类：

public class Cat { 
　　private double weight; 
　　private int age; 

　　public Cat(double _weight, int _age) { 
    　　this.weight = _weight; 
    　　this.age = _age; 
　　} 

    //get set 方法... 
}

我们可能在其他程序中new出一只猫来，像这样：

public class Demo{ 
    public static void main(String[] args){ 
        Cat kitty=new Cat(3.0,2); 
    } 
}

那么这个new过程是怎么进行的呢？

按照上面对String类型new的分析，大家可能想，这个简单，先在栈内存中定义引用变量kitty，然后在堆内存中分配一块空间，将kitty猫的属性存放进去，最后让引用变量指向这个空间，完了。

对，大家这样分析大体是正确的，但大家好像忽略了一个重要的细节，kitty猫的属性是怎样存进堆内存空间的呢？

我们来看看Cat这个类的构造函数吧，它定义了两个形参，也就是局部变量，在我们试图通过new向它传实参值时，在栈内存中定义了两个引用变量，_weight，_age并赋值，即两个引用变量所在栈内存中内容分别为3.0，2，同时在堆中开辟了一块新空间，空间中有两个内存区域，而内存中内容为系统初始化内容。然后通过构造函数将栈内存中值赋给堆内存中值，就这样堆内存中新空间就被赋值了，接下来就像大家所想的那样将引用kitty指向这块新空间。大家可能会想，那么栈中分配出来的那两块内存怎么处理呢？
其实，做完上面的事情后，局部变量将从栈中弹出，这个过程是自发的，它有别于JVM垃圾收集，JVM垃圾收集主要是用来释放堆内存空间，某块堆内存在没被引用，或引用它的变量再也不会被使用时将被回收。

噢，好长的分析啊，不知道大家看得怎么样了，我们继续吧。

假设在Demo类中有一个方法，像这样：

public void change(Cat _cat){ 
　　_cat.setAge(5); 
}

那么把刚才new出来的 kitty传入该方法中，像这样：

Demo demo = new Demo();
Cat kitty = new Cat(3.0,2);
demo.change(kitty);
System.out.print(kitty.getAge());

程序将打印kitty的age，那么该age会变化吗？

可能大家受到C语言中一个著名问题，也就是swap（交换）问题（见下面）的影响，得出了不会变的结论，也就是将打印2，但事实并非如此，该程序将打印5，那么到底发生了什么呢？让我们从程序内存变化情况，来解释这个现象吧。
首先，按前面我们的分析，new出kitty猫时，在栈内存中定义了一个引用，指向堆中分配的内存，堆内存存放kitty猫的信息。
然后，我们开始调用change方法了，在我们把kitty传给该方法时，在栈内存中就定义了局部变量_cat，该引用变量将被指向kitty所指向的堆内存区域，然后_cat对它指向的堆内存区域内容进行了更改，这不就是kitty所指堆内存区域被更改了吗？因为它们指向同一块堆内存。就这样，调用kitty.getAge()时，将得到5这样的结果。最后，分配出来的_cat将从栈中弹出。

分析到这里，我们再回头看，swap（交换）问题
我们都知道在C语言里有个方法像这样：

void swap(int a, int b) {
    int temp = a;
    int a = b;
    int b = temp;
}

然后在主函数中使用它，像这样：

int a = 2;
int b = 5;
swap(a, b);

我们都知道这是无法交换a，b的值的，可是大家是否还记得解决方法呢，怎么解决这个问题呢？在C语言中我们用指针，像这样：

void swap(int *a, int *a) { 
    int temp = *a; 
    *a = *b; 
    *b = temp; 
} 
main() { 
    int a = 2; 
    int b = 5; 
    swap(&a, &b); 
}

看到这里，大家可能想起来了，这里使用了引用。

说到这里，大家是不是豁然开朗了呢，在Java栈内存中存放的就是引用啊，所以Java虽然没有显式的指针，但处处是指针。

====================================================================
好了，休息一下，我们再继续

随着一步步深入，大家可能对Java程序内存分配情况有了大致的了解，那么让我们一起来谈谈更高级的主题吧。
在文章开头我们使用String类例子，大家是不是觉得有点别扭呢？是啊，可能大家定义String都是像下面这样直接定义的，但这样有什么不同呢？

String s1 = "abc";
String s2 = "abc";
System.out.print(s1.equals(s2)); // 1
System.out.print(s1 == s2); // 2

显然，上面程序第1条打印语句，输出的是true，那么第二条呢？

如果大家运行该程序，第2条打印的也是true，为什么呢？大家是不是有点迷糊了呢，好，让我们来分析一下这个程序内存分配情况吧。

在这里我们先介绍一个高级概念：常量池
JVM虚拟机为每个被装载的类型维护一个常量池。常量池就是该类型所用到常量的一个有序集和，包括直接常量（string,integer和 floating point常量）和对其他类型，字段和方法的符号引用。对于String常量，它的值是在常量池中的。而JVM中的常量池在内存当中是以表的形式存在的，对于String类型，有一张固定长度的CONSTANT_String_info表用来存储文字字符串值，注意：该表只存储文字字符串值，不存储符号引用。说到这里，对常量池中的字符串值的存储位置应该有一个比较明了的理解了。
在介绍完JVM常量池的概念后，接着我们谈开始前面提到的“abc”的值的内存分布的位置。对“abc”的值，实际上是在class文件被JVM装载到内存当中就已经为“abc”这个字符串在常量池的CONSTANT_String_info表中分配了空间来存储“abc”这个值。既然“abc”这个字符串常量存储在常量池中，常量池是属于类型信息的一部分，类型信息也就是每一个被转载的类型，这个类型反映到JVM内存模型中是对应存在于JVM内存模型的方法区中，也就是这个类型信息中的常量池是存在于在方法区中，方法区可以在一个堆中自由分配。
这也就说明了为什么s1==s2，因为它们俩都是指向常量池中“abc”串的引用，而像文章开头里提到的new出来的String在新分配的堆内存中内容“abc”，只是常量池中“abc”串的拷贝。所以，请大家不要用new方法来初始化String类型，直接赋值就可以了。

好，先说到这里了，希望通过这篇文章大家对Java程序内存有所了解。