jvm入门及理解（四）——运行时数据区（堆+方法区）

一、堆

定义： Heap，通过new关键字创建的对象，都存放在堆内存中。

特点

线程共享，堆中的对象都存在线程安全的问题
垃圾回收，垃圾回收机制重点区域。

jvm内存的划分：

JVM内存划分为堆内存和非堆内存，堆内存分为年轻代（Young Generation）、老年代（Old Generation），非堆内存就一个永久代（Permanent Generation）。
年轻代又分为Eden和Survivor区。Survivor区由FromSpace和ToSpace组成。Eden区占大容量，Survivor两个区占小容量，默认比例是8:1:1。
非堆内存用途：永久代，也称为方法区，存储程序运行时长期存活的对象，比如类的元数据、方法、常量、属性等。
年轻代（New）：年轻代用来存放JVM刚分配的Java对象
年老代（Tenured)：年轻代中经过垃圾回收没有回收掉的对象将被Copy到年老代
永久代（Perm）：永久代存放Class、Method元信息，其大小跟项目的规模、类、方法的量有关，一般设置为128M就足够，设置原则是预留30%的空间，方法区。

堆内存查看的相关指令：

　　查看系统有哪些进程。

jmap

　　查看堆内存使用情况 jmap -heap PID

jconsole

　　图形界面，多功能检测工具，连续监测

二、方法区

定义：其中主要存储class文件的信息和运行时常量池,class文件的信息包括类信息和class文件常量池。

class文件结构：

最头的4个字节用于存储魔数Magic Number，用于确定一个文件是否能被JVM接受
接着4个字节用于存储版本号，前2个字节存储次版本号，后2个存储主版本号
再接着是用于存放常量的常量池，由于常量的数量是不固定的，所以常量池的入口放置一个U2类型的数据(constant_pool_count)存储常量池容量计数值、类信息、父类与接口数组、方法信息。

三、常量池、运行时常量池、字符串池

1、常量池：就是一张表，虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息，我们可以通过Javap -v 类名.class 指令反编译一个简单的程序看到如下的常量池信息

左边“#1”为常量池中的符号地址。

2、运行时常量池：常量池是 class 文件中的，当该类被加载，它的常量池信息就会放入运行时常量池，并把里面的符号地址变为真实地址。

3、字符串池：在JVM里实现字符串池功能的是一个StringTable类，它的底层是一个HashTable，里面存的是字符串对象的引用（而不是字符串实例本身），真正的字符串实例是存放在堆内存中的（并且字符串池在逻辑上是属于运行时常量池的一部分）

4.常量池和字符串池的关系：

下面来看段代码：

public static void main(String[] args) {
        String s1 = "b";
        String s2 = "c";
        String str = new String("b");
        System.out.println(s1 == str);  //false
    }

然后通过反编译观察字节码文件

说明：在jdk1.8时，最开始编译时字符串都是常量池中的符号，尚未转化为对象，当程序执行时，常量池中的信息都会被加载到运行时常量池中，这才转化成了对象，并且看StringTable中有没有"b","c"对象，如果没有则把 "b" 和 "c" 对象的引用值存入StringTable,真正的对象实例则在堆中；如果有的话则不会存入，这样就避免了重复创建字符串对象。

再来分析String str = new String("b")这行代码：

可以看出，这行代码创建的对象个数因StringTable中有没有“b”对象而异，如果字符串池有“b”,则此时只会创建一个对象：也就是new的一个字符串对象，存放在堆中；如果没有就会创建两个对象，一个是new的对象存放在堆中，一个是“b”字符串常量对象，存放在StringTable中。

下面我们再看一个例子：

public class HelloWorld {
    public static void main(String []args) {
        String str1 = "abc"; 
        String str2 = new String("def"); 
        String str3 = "abc"; 
        String str4 = str2.intern(); 
        String str5 = "def"; 
        System.out.println(str1 == str3);//true 
        System.out.println(str2 == str4);//false 
        System.out.println(str4 == str5);//true
    }
}

看到String str3 = "abc"; 解析str3时，在StringTable中寻找“abc”，会发现str1的值已经在stringTable中，所以str3的引用地址和str1相同，不会创建不同的对象，即str1==str3为true;

看到String str4 = str2.intern();我们可以知道，intern()函数返回StringTable中”def”的引用值。因为StringTable中已经有“def”引用值，即返回str2中new出来的“def”在StringTable中的引用值。

StringTable 的位置

jdk6（永久代实现）和jdk8（元空间实现）中方法区的区别，其中最主要的区别是将方法区转移到本地内存中，且常量池分为运行时常量池和字符串常量池；且字符串常量池被留在内存中的堆中。

原因：

StringTable中存在大量的字符串对象，运行时间增长永久代内存占用过多，且永久代只有在触发FULL GC时才进行垃圾回收，回收频率过慢。
转移到堆中可以利用虚拟机在堆内存中频繁的垃圾回收，处理StringTable中对象过多情况。

永久代和元空间内存溢出的区别：

jdk1.6
jdk1.8

jdk1.8和jdk1.6中intern()方法的运用

1.8 将这个字符串对象尝试放入串池，如果有则并不会放入，如果没有则将该字符串的引用放入串池
1.6 将这个字符串对象尝试放入串池，如果有则并不会放入，如果没有会把此对象复制一份，放入串池

总结

全局字符串池每个虚拟机只有一个，存储字符串常量的引用值；
class常量池是java程序编译之后才有的，每个类都有，存放字面值和符号引用常量；
运行时常量池是在类加载完之后，常量池内容存储在运行时常量池中，每个类都有一个，且常量池中符号引用转换为直接引用，与全局字符串池中保持一致。

StringTable调优：

调整hash表中桶子个数，-XX:StringTableSize=桶个数
考虑字符串是否入池

四、直接内存

常见于NIO操作中，用于数据缓冲
分配回收成本高，但读写能力强
不受JVM内存回收管理

直接内存使用前后的对比：

使用前：

说明：

因为java无法操作本地文件，在java堆内存中划出java缓冲区；
从用户态转移到内核态，本地方法在系统内存中划出一段系统缓冲区，将磁盘文件分部分缓冲到系统缓冲区中，间接的将系统缓冲区中数据传输到java缓冲区中；
内核态转到用户态，调用输出流写入操作，将文件copy到另一个位置，循环copy，直到全部复制完成。

使用后：

说明：

ByteBuffer.allocateDirect(_size)，在系统内存中分配直接内存；
系统方法和java方法都可以访问直接内存；
与不使用直接内存相比，减少了一次从系统缓存区向java缓冲区复制的操作，复制效率成倍上升。

直接内存的回收：

使用Unsafe对象实现直接内存的分配回收，回收主要使用的是freeMemory方法
ByteBuffer类内部，使用了Cleaner（虚引用）来检测ByteBuffer对象，一旦对象被回收，就会由ReferenceHandler线程通过Cleaner的clean对象调用freeMenory来释放直接内存。
-XX:+DisableExplicitGC 显式的System.gc()显式的垃圾回收 FULL GC，被禁用。
因为考虑到系统性能，FULL GC时间够长，会严重影响性能。所以涉及到直接内存的使用，释放内存使用Unsafe.freeMemory，不建议使用System.gc()。

点我阅读