Java虚拟机 --- 垃圾回收机制

一,如何确定对象已死

1,引用技术算法:

  给对象中添加一个引用技术器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1,任何时刻计数器为0的对象就是已死对象。

  主流Java虚拟机没有选用引用计数算法来管理内存的,原因是它很难解决对象之间相互循环引用的问题。

2,可达性分析算法:

  基本思路是通过一系列的称为GC Roots的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

  在Java语言中,可作为GC Roots的对象包括下面几种:

    虚拟机栈中引用的对象

    方法区中类静态属性引用的对象。

    方法区中常量引用的对象。

    本地方法栈中JNI引用的对象。

3,引用

  以前Java引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。但是当描述这样一类对象时引用就无能为力了:当内存空间还足够时,则能保留在内存之中;如果内存空间在进行垃圾收集之后还是非常紧张,则可以抛弃这些对象。所以Java对引用的概念进行了扩充,将引用分为强引用,软引用,弱引用,虚引用4种:

  • 强引用:类似Object obj = new Object()这类的引用,只要强引用还存在,垃圾收集器永远不会回收被引用的对象。
  • 软引用(SoftReference):描述一些还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。
  • 弱引用(WeakReference):也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前,当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
  • 虚引用(PhantomReference):最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例,为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时受到一个系统通知。

4, finalize方法

  即使在可达性分析算法中不可达的对象,也并非是非死不可的。如果对象在进行可达性分析后发现没有与GC Root相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法,当对象没有覆盖finalize()方法,或者finalize方法已经被调用过,那就没有必要执行。如果有必要执行,那这个对象会被放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的/低优先级的Finalizer线程去执行它。这里的执行是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,因为如果一个对象在finalize方法中执行缓慢,或发生了死循环,就会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize中拯救自己---只要重新与引用链上的任何一个对象建立关联即可,那在第二次标记时它将被移出即将回收集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。

  不建议使用finalize方法,因为它的运行代价高昂,不确定性大,无法保证各个对象的调用顺序。

5,回收方法区

  在方法区进行垃圾收集的性价比比较低,所以Java虚拟机确实说过可以不要求虚拟机在方法区实现垃圾收集。

  方法区的垃圾收集主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。而无用的类必须同时满足下面3个条件:a,该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。b,加载该类的ClassLoader已经被回收。c,该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

 

二,垃圾收集算法

1,标记-清除算法

  首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。它的主要不足有两个:一个是效率问题,标记和清除两个过程效率都不高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后再程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

2,复制算法

  它将可用内存按容量分为大小相等的两块,每次只适用其中的一块。当一块的内存用完了,就将还存活着的对象复制到另一块上,然后再把已经使用过的内存空间一次清理掉。这样实现简单,运行高效。但是代价就是将内存缩小为了原来的一半。

  现在的商业虚拟机都使用这种复制算法来回收新生代。研究表明,新生代中98%的对象都是朝生夕死的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1,也就是每次新生代中可用内存空间为整个新生代容量的90%,只有10%的内存会被浪费。当然,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够用时,需要依赖其他内存进行分配担保。也就是说如果另外一块Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制进入老年代。

3,标记整理算法

  复制算法在对象存活率较高时就需要进行较多的复制操作,效率会变低。所以在老年代一般不能直接选用这种算法,而是使用标记整理算法,即先标记,然后让所有存活对象都向一端移动,然后清理掉端边界以外的内存。

4,分代收集算法

  当前商业虚拟机的垃圾收集都采用“分代收集”算法,根据对象存活周期的不同把Java堆分为新生代和老年代。在新生代中采用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高,没有额外空间对它进行分配担保,就必须使用“标记--清理”或者“标记--整理”算法来进行回收了。

5,枚举根节点

  因为可达性分析必须在一个能确保一致性的快照中进行---这里“一致性”的意思是指整个分析期间整个执行系统看起来就像被冻结在某个时间点上,不可以出现分析过程中对象引用关系还在不断变化的情况,该点不满足的话分析结果准确性就无法得到保证。这是导致GC进行时必须停顿所有Java执行线程(也称为Stop The World)的其中一个重要原因。 

6, 内存分配与回收策略

  • 对象优先在Eden分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。Minor GC指发生在新生代的垃圾收集动作,Minor GC非常频繁,一般回收速度也比较快。Major GC/Full GC是发生在老年代的GC,经常会伴随至少一次的Minor GC。Major GC的速度一般会比Minor GC慢10倍以上。
  • 大对象直接进入老年代。大对象是指需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组。经常出现大对象容易导致内存还有不少空间时就提前出发垃圾收集以获取足够的连续空间来安置这些大对象。虚拟机提供了一个--XX:PretenureSizeThreashold参数,令大于这个设置值的对象直接在老年代分配。这样做是为了避免在Eden区及两个Survivor区之间发生大量的内存复制。
  • 长期存活的对象将进入老年代。内存回收时必须能识别哪些对象应放在新生代,哪些对象应放在老年代。虚拟机给每个对象定义了一个对象年龄计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁),就将会被晋升到老年代中。对象晋升老年代的年龄阈值,可以通过参数-XX:MaxTenuringThreashold设置。
  • 动态对象年龄判定。虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshlod才能晋升老年代,如果在在Suvivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。
  • 空间分配担保。虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么回继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这次Minor GC是有风险的;如果小于,或者HandlePromotionFailed设置不允许冒险,那这时就改为进行一次Full GC。
原文地址:https://www.cnblogs.com/IvySue/p/7660324.html