jvm入门及理解(四)——运行时数据区(堆+方法区)

一、堆

定义: Heap,通过new关键字创建的对象,都存放在堆内存中。

特点

  • 线程共享,堆中的对象都存在线程安全的问题
  • 垃圾回收,垃圾回收机制重点区域。

jvm内存的划分:

  • JVM内存划分为堆内存和非堆内存,堆内存分为年轻代(Young Generation)、老年代(Old Generation),非堆内存就一个永久代(Permanent Generation)。
  • 年轻代又分为Eden和Survivor区。Survivor区由FromSpace和ToSpace组成。Eden区占大容量,Survivor两个区占小容量,默认比例是8:1:1。
  • 非堆内存用途:永久代,也称为方法区,存储程序运行时长期存活的对象,比如类的元数据、方法、常量、属性等。
  • 年轻代(New):年轻代用来存放JVM刚分配的Java对象
  • 年老代(Tenured):年轻代中经过垃圾回收没有回收掉的对象将被Copy到年老代
  • 永久代(Perm):永久代存放Class、Method元信息,其大小跟项目的规模、类、方法的量有关,一般设置为128M就足够,设置原则是预留30%的空间,方法区。

堆内存查看的相关指令:

  • jps

  查看系统有哪些进程。

  • jmap

  查看堆内存使用情况 jmap -heap PID

  • jconsole

  图形界面,多功能检测工具,连续监测

二、方法区

定义: 其中主要存储class文件的信息和运行时常量池,class文件的信息包括类信息和class文件常量池。

class文件结构:

  • 最头的4个字节用于存储魔数Magic Number,用于确定一个文件是否能被JVM接受
  • 接着4个字节用于存储版本号,前2个字节存储次版本号,后2个存储主版本号
  • 再接着是用于存放常量的常量池,由于常量的数量是不固定的,所以常量池的入口放置一个U2类型的数据(constant_pool_count)存储常量池容量计数值、类信息、父类与接口数组、方法信息。

三、常量池、运行时常量池、字符串池

1、常量池:就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息,我们可以通过Javap -v  类名.class 指令反编译一个简单的程序看到如下的常量池信息

 左边“#1”为常量池中的符号地址。

2、运行时常量池:常量池是 class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址。

3、字符串池:在JVM里实现字符串池功能的是一个StringTable类,它的底层是一个HashTable,里面存的是字符串对象的引用(而不是字符串实例本身),真正的字符串实例是存放在堆内存中的(并且字符串池在逻辑上是属于运行时常量池的一部分)

4.常量池和字符串池的关系:

下面来看段代码:

public static void main(String[] args) {
        String s1 = "b";
        String s2 = "c";
        String str = new String("b");
        System.out.println(s1 == str);  //false
    }

然后通过反编译观察字节码文件

 

说明:在jdk1.8时,最开始编译时字符串都是常量池中的符号,尚未转化为对象,当程序执行时,常量池中的信息都会被加载到运行时常量池中,这才转化成了对象,并且看StringTable中有没有"b","c"对象,如果没有则把 "b" 和 "c" 对象的引用值存入StringTable,真正的对象实例则在堆中;如果有的话则不会存入,这样就避免了重复创建字符串对象。

再来分析String str = new String("b")这行代码:

 可以看出,这行代码创建的对象个数因StringTable中有没有“b”对象而异,如果字符串池有“b”,则此时只会创建一个对象:也就是new的一个字符串对象,存放在堆中;如果没有就会创建两个对象,一个是new的对象存放在堆中,一个是“b”字符串常量对象,存放在StringTable中。

下面我们再看一个例子:

public class HelloWorld {
    public static void main(String []args) {
        String str1 = "abc"; 
        String str2 = new String("def"); 
        String str3 = "abc"; 
        String str4 = str2.intern(); 
        String str5 = "def"; 
        System.out.println(str1 == str3);//true 
        System.out.println(str2 == str4);//false 
        System.out.println(str4 == str5);//true
    }
}

看到String str3 = "abc"; 解析str3时,在StringTable中寻找“abc”,会发现str1的值已经在stringTable中,所以str3的引用地址和str1相同,不会创建不同的对象,即str1==str3为true;

看到String str4 = str2.intern();我们可以知道,intern()函数返回StringTable中”def”的引用值。因为StringTable中已经有“def”引用值,即返回str2中new出来的“def”在StringTable中的引用值。

StringTable 的位置

 jdk6(永久代实现)和jdk8(元空间实现)中方法区的区别,其中最主要的区别是将方法区转移到本地内存中,且常量池分为运行时常量池和字符串常量池;且字符串常量池被留在内存中的堆中。

原因:

  • StringTable中存在大量的字符串对象,运行时间增长永久代内存占用过多,且永久代只有在触发FULL GC时才进行垃圾回收,回收频率过慢。
  • 转移到堆中可以利用虚拟机在堆内存中频繁的垃圾回收,处理StringTable中对象过多情况。

 永久代和元空间内存溢出的区别:

  • jdk1.6
  •  jdk1.8

jdk1.8和jdk1.6中intern()方法的运用

  • 1.8 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有则将该字符串的引用放入串池
  • 1.6 将这个字符串对象尝试放入串池,如果有则并不会放入,如果没有会把此对象复制一份,放入串池

总结

  1. 全局字符串池每个虚拟机只有一个,存储字符串常量的引用值;
  2. class常量池是java程序编译之后才有的,每个类都有,存放字面值和符号引用常量;
  3. 运行时常量池是在类加载完之后,常量池内容存储在运行时常量池中,每个类都有一个,且常量池中符号引用转换为直接引用,与全局字符串池中保持一致。

StringTable调优:

  • 调整hash表中桶子个数,-XX:StringTableSize=桶个数
  • 考虑字符串是否入池

四、直接内存

  • 常见于NIO操作中,用于数据缓冲
  • 分配回收成本高,但读写能力强
  • 不受JVM内存回收管理

直接内存使用前后的对比:

使用前:

 说明:

  • 因为java无法操作本地文件,在java堆内存中划出java缓冲区;
  • 从用户态转移到内核态,本地方法在系统内存中划出一段系统缓冲区,将磁盘文件分部分缓冲到系统缓冲区中,间接的将系统缓冲区中数据传输到java缓冲区中;
  • 内核态转到用户态,调用输出流写入操作,将文件copy到另一个位置,循环copy,直到全部复制完成。

使用后:

 说明:

  • ByteBuffer.allocateDirect(_size),在系统内存中分配直接内存;
  • 系统方法和java方法都可以访问直接内存;
  • 与不使用直接内存相比,减少了一次从系统缓存区向java缓冲区复制的操作,复制效率成倍上升。

直接内存的回收:

  • 使用Unsafe对象实现直接内存的分配回收,回收主要使用的是freeMemory方法
  • ByteBuffer类内部,使用了Cleaner(虚引用)来检测ByteBuffer对象,一旦对象被回收,就会由ReferenceHandler线程通过Cleaner的clean对象调用freeMenory来释放直接内存。
  • -XX:+DisableExplicitGC 显式的System.gc()显式的垃圾回收 FULL GC,被禁用。
  • 因为考虑到系统性能,FULL GC时间够长,会严重影响性能。所以涉及到直接内存的使用,释放内存使用Unsafe.freeMemory,不建议使用System.gc()。

原文地址:https://www.cnblogs.com/lwkdbk/p/12715330.html