JVM内存结构和6大区域

对于我们一般理解的计算机内存，它算是CPU与计算机打交道最频繁的区域，所有数据都是先经过硬盘至内存，然后由CPU再从内存中获取数据进行处理，又将数据保存到内存，通过分页或分片技术将内存中的数据再flush至硬盘。那JVM的内存结构到底是如何呢？JVM作为一个运行在操作系统上，但有独立与OS运行的平台，它的内存至少应该包括象寄存器，堆栈等区域。

JVM在运行时将数据划分为六个区域来存储，而不仅仅是大家熟知的Heap区域，这六个区域图示如下：

PC Register（PC寄存器）

PC寄存器是一块很小的内存区域，主要作用是记录当前线程所执行的字节码的行号。字节码解释器工作时就是通过改变当前线程的程序计数器选取下一条字节码指令来工作的。任何分支，循环，方法调用，判断，异常处理，线程等待以及恢复线程，递归等等都是通过这个计数器来完成的。

由于java多线程是通过交替线程轮流切换并分配处理器时间的方式来实现的，在任何一个确定的时间里，在处理器的一个内核只会执行一条线程中的指令。因此为了线程等待结束需要恢复到正确的位置执行，每条线程都会有一个独立的程序计数器来记录当前指令的行号。计数器之间相互独立互不影响，我们称这块内存为“线程私有”的内存。

如果所调用的方法为native的，则PC寄存器中不存储任何信息。

JVM栈 (Stack)

JVM栈是线程私有的，每个线程创建的同时都会创建JVM栈，JVM栈中存放的为当前线程中局部基本类型的变量（java中定义的八种基本类型：boolean、char、byte、short、int、long、float、double）、部分的返回结果以及Stack Frame，非基本类型的对象在JVM栈上仅存放一个指向堆上的地址，因此Java中基本类型的变量是值传递，而非基本类型的变量是引用传递，Sun JDK的实现中JVM栈的空间是在物理内存上分配的，而不是从堆上分配。

由于JVM栈是线程私有的，因此其在内存分配上非常高效，并且当线程运行完毕后，这些内存也就被自动回收。

当JVM栈的空间不足时，会抛出StackOverflowError的错误，在Sun JDK中可以通过-Xss来指定栈的大小，例如如下代码：

new Thread(new Runnable(){   
           public void run() {   
              loop(0);   
           }          
           private void loop (int i){   
              if(i!=1000){   
                  i++;   
loop (i);   
              }   
              else{   
                  return;   
              }   
           }   
          }).start();

当JVM参数设置为-Xss1K，运行后会报出类似下面的错误：
Exception in thread “Thread-0″java.lang.StackOverflowError

堆（Heap）

Heap是大家最为熟悉的区域，它是JVM用来存储对象实例以及数组值的区域，可以认为Java中所有通过new创建的对象的内存都在此分配，Heap中的对象的内存需要等待GC进行回收，Heap在32位的操作系统上最大为2G，在64位的操作系统上则没有限制，其大小通过-Xms和-Xmx来控制，-Xms为JVM启动时申请的最小Heap内存，默认为物理内存的1/64但小于1G，-Xmx为JVM可申请的最大Heap内存，默认为物理内存的1/4，默认当空余堆内存小于40%时，JVM会增大Heap的大小到-Xmx指定的大小，可通过-XX:MinHeapFreeRatio=来指定这个比例，当空余堆内存大于70%时，JVM会将Heap的大小往-Xms指定的大小调整，可通过-XX:MaxHeapFreeRatio=来指定这个比例，但对于运行系统而言，为了避免频繁的Heap Size的大小，通常都会将-Xms和-Xmx的值设成一样，因此这两个用于调整比例的参数通常是没用的。其实jvm中对于堆内存的分配、使用、管理、收集等有更为精巧的设计，具体可以在JVM堆内存分析中进行详细介绍。

当堆中需要使用的内存超过其允许的大小时，会抛出OutOfMemory的错误信息。

方法区域（MethodArea）

方法区域存放了所加载的类的信息（名称、修饰符等）、类中的静态变量、类中定义为final类型的常量、类中的Field信息、类中的方法信息，当开发人员在程序中通过Class对象中的getName、isInterface等方法来获取信息时，这些数据都来源于方法区域，可见方法区域的重要性。同样，方法区域也是全局共享的，它在虚拟机启动时在一定的条件下它也会被GC，当方法区域需要使用的内存超过其允许的大小时，会抛出OutOfMemory的错误信息。

在Sun JDK中这块区域对应的为PermanetGeneration，又称为持久代，默认为64M，可通过-XX:PermSize以及-XX:MaxPermSize来指定其大小。

运行时常量池（RuntimeConstant Pool）

类似C中的符号表，存放的为类中的固定的常量信息、方法和Field的引用信息等，其空间从方法区域中分配。类或接口的常量池在该类的class文件被java虚拟机成功装载时分配。

本地方法堆栈（NativeMethod Stacks）

JVM采用本地方法堆栈来支持native方法的执行，此区域用于存储每个native方法调用的状态。

例如有这么一段代码：

Java代码

public class A {   
                   public static void main(String[]args){   
           String a="a";   
          String b="b";   
           String ab="ab";   
           System.out.println((a+b)==ab);       // false   
           System.out.println(("a"+"b")==ab);   // true   
           final String afinal="a";   
           String result=afinal+"b";   
           System.out.println(result==ab);      // true   
           String plus=a+"b";   
           System.out.println(plus==ab);        // false   
             System.out.println(plus.intern()==ab);  // true   
    }   
}

分析下上面代码执行的结果，可通过javap –verbose A来辅助理解分析。

(a+b)==ab

a+b是两个变量相加，需要到运行时才能确定其值，到运行时后JVM会为两者相加后产生一个新的对象，因此a+b==ab的结果为false。

(“a”+”b”)==ab

“a”+”b”是常量，在编译时JVM已经将其变为”ab”字符串了，而ab=”ab”也是常量，这两者在常量池即为同一地址，因此(“a”+”b”)==ab为true。

result==ab

result=afinal+”b”，afinal是个final的变量， result在编译时也已经被转变为了”ab”，和”ab”在常量池中同样为同一地址，因此result==ab为true。

plus=ab

plus和a+b的情况是相同的，因此plus==ab为false。

plus.intern()==ab

这里的不同点在于调用了plus.intern()方法，这个方法的作用是获取plus指向的常量池地址，因此plus.intern()==ab为true。

在掌握了JVM对象内存分配的机制后，接下来看看JVM是如何做到自动的对象内存回收的，这里指的的是Heap以及Method Area的回收，其他几个区域的回收都由JVM简单的按生命周期来进行管理。