深入理解JVM(二)垃圾收集器

GC三问:

哪些内存需要回收?

什么时候回收?

如何回收?

程序计数器、虚拟机栈、本地方法栈随线程而生,随线程而灭,栈帧的内存分配在类结构确定下来就已知,在方法结束或者线程结束时就会回收。所以垃圾回收关注的是动态的堆内存。

ps. 方法区也能被回收,主要回收废弃常量和无用类,但性价比高,不过多描述。

1.哪些内存需要回收

这个问题的关键就是确定哪些内存是存活着,哪些内存死去(不再会被用到的)

引用计数算法

有引用时就+1,引用失效就-1,计数器为0则可回收

无法回收相互引用的情况

引用分为强引用、软引用、弱引用、虚引用,引用强度递减

  • 强引用

    • 普遍存在的,Object obj = new Object()

    • 只要强引用存在,垃圾收集器永远不会回收掉被引用的对象

  • 软引用

    • 对象在有用但非必须

    • 内存不足时才会回收

    • 实现高速缓存

    • String str = new String("abc");
      SoftReference<String> softRef = new SoftReference<String>(str);
      
  • 弱引用

    • 非必须,比软引用弱

    • GC时会被回收(概率不大,优先级低)

    • 适用于偶尔被使用不影响垃圾收集的对象

    • String str = new String("abc");
      WeakReference<String> weakRef = new WeakReference<String>(str);
      
  • 虚引用

    • 不决定对象生命周期

    • 任何时候可回收

    • 跟踪对象被垃圾收集器回收的活动

    • 必须和引用队列ReferenceQueue联合使用

    • String str = new String("abc");
      ReferenceQueue queue = new ReferenceQueue();
      PhantomReference<String> phantomRef = new PhantomReference<String>(str,queue);

可达性分析

从GC Roots作为起始点向下,搜索走过的路径称为引用链,当一个对象到GC Roots没有任何引用链则为不可达,判定为可回收对象。

什么对象可以作为GC Roots

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 方法区的类静态属性引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中native方法引用的对象

要判定一个对象的死亡,需要经过两次标记:第一次未与GC Roots相连的节点会经过第一次标记并进行一次筛选。筛选的条件是此对象是否有必要执行finalize()方法(对象没有覆盖finalize()或者finalize()已经被调用过则为没有必要执行)。经过第一次标记后的对象会被放入F-Queue的队列中,由虚拟机自动创建、优先级低的Finalizer线程去执行他。对象可以在finalize()方法中实现自救,如果自救成功会被移出队列,不再回收。

算法实现

GC进行时必须停顿所有Java执行线程,用于枚举根节点,称之为Stop-the-World,减少STW的次数来优化GC。

但程序并非在所有位置都能停顿下来,需要到达SafePoint才能暂停,这种中断方案有两种,抢先式中断和主动式中断。

抢先式中断

中断所有线程,如果线程中断的地方不在SafePoint,恢复线程让他跑到安全点。目前几乎不用

主动式中断

设置一个标志,线程主动轮询这个标志,如果发现需要中断就中断。另外轮询的位置和SafePoint是重合的,也就是在每个安全点会轮询判断是否需要中断。

2.内存分配和回收策略

  • 对象优先在Eden分配

    • Eden区】 空间不足时触发minor GC
    • Survivor区from】 第一次minor GC 从Eden区复制到from 年龄+1
    • Survivor区to】 第二次 minor GC 对Eden和from拷贝到to 年龄+1 from 和to互换 清空from和eden

    young_gc

    在GC开始的时候,对象只会存在于Eden区和From区,To区是空的。紧接着进行GC,Eden区中所有存活的对象都会被复制到To,而在From区中,仍存活的对象会根据他们的年龄值来决定去向。年龄达到一定值(年龄阈值,可以通过-XX:MaxTenuringThreshold来设置)的对象会被移动到年老代中没有达到阈值的对象会被复制到To区域。经过这次GC后,Eden区和From区已经被清空。这个时候,“From”和“To”会交换他们的角色,也就是新的To就是上次GC前的From,新的From就是上次GC前的To。不管怎样,都会保证名为To的Survivor区域是空的。Minor GC会一直重复这样的过程,直到To区被填满,To区被填满之后,会将所有对象移动到年老代中。

    -Xmn10M 分配给新生代的内存

    -XX:SurvivorRatio=8 指定新生代Eden区和Survivor区的空间比例。

  • 大对象直接进入老年代

    可以通过设置-XX:PretenureSizeThreShold,大于这个值的对象直接进入老年代

  • 长期存活的对象进入老年代

  • Full GC触发条件

    • 老年代空间不足
    • 永久代空间不足(JDK7前)
    • CMS GC(Concurrent Mark Sweep 并发标记清理) 出现promotion failed concurrent mode failure
    • promotion failed 年轻代和老年代都放不下
    • 同时有对象要放入老年代,老年代空间不足
    • minor GC晋升到老年代平均大小大于老年代剩余空间
    • System.gc()
    • 使用RMI进行RPC或管理 JDK,一小时一次

3.垃圾回收算法

标记-清除算法(Mark-Sweep)

标记:从根集合扫描,对存活对象标记

清除:对堆内存从头到尾进行线性遍历,回收不可达对象内存

缺点:

  • 效率低:标记和清除两个过程小徐都不高
  • 碎片化:会产生大量不连续的内存碎片,在分配大对象时可能需要提前触发垃圾回收动作

复制算法(Copying)

分为对象面和空闲面,对象在对象面上创建

清理时存活的对象被从对象面复制到空闲面,再将对象面所有对象内存清除

优点:

  • 解决碎片化问题
  • 顺序分配内存,简单高效
  • 适用于对象存活率低的场景(新生代回收)

缺点:

  • 造成内存的缩小,可用内存减少

标记-整理算法

标记:从根集合扫描,对存活对象标记

清除:移动所有存活对象,按照内存地址排序,然后将末端内存地址以后内存全部回收

缺点:

  • 成本高,适用于存活率高的场景

分代收集算法

把堆分成几代,,根据代的特点采用合适的垃圾回收算法

4.垃圾收集器

  • JVM运行模式

JVM有两种运行模式Server与Client。两种模式的区别在于,Client模式启动速度较快,Server模式启动较慢;但是启动进入稳定期长期运行之后Server模式的程序运行速度比Client要快很多。这是因为Server模式启动的JVM采用的是重量级的虚拟机,对程序采用了更多的优化;而Client模式启动的JVM采用的是轻量级的虚拟机。所以Server启动慢,但稳定后速度比Client远远要快。

~ $ java -version
java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

以上命令可以看到当前使用的是什么模式的JVM


以下是新生代收集器

  • 垃圾收集器的联系

垃圾收集器组合

Serial收集器 -XX:+UseSerialGC 复制算法

  • 单线程收集
  • 简单高效,client模式默认

Serial收集器

ParNew收集器 -XX:+UseParNewGC 复制算法

  • 多线程收集
  • 单核不如Serial 多核有优势

ParNew收集器

Parallel Scavenge收集器 -XX:+UseParallelGC 复制

  • 吞吐量=(运行用户代码时间/运行用户代码时间+垃圾收集时间)
  • 关注吞吐量
  • 多核执行有优势 server默认
  • -XX:+UseAdaptiveSizePolicy

以下都是老年代的收集器

Serial Old收集器 -XX:+UseSerialOldGC 标记整理算法

  • Client 默认

Parallel Old收集器 标记整理

  • 多线程,吞吐量优先

CMS 收集器 -XX:+UseConcMarkSweepGc 标记清除算法

以获取最短停顿时间为目标。

  • 步骤
    • stop-the-world,初始标记
    • 并发标记:并发追溯标记(与用户线程并发)
    • 并发预清理,查找并发标记阶段从年轻代晋升到老年代对象
    • 重新标记:stop-the-world 扫描CMS剩余对象
    • 并发清理:清理垃圾对象,程序不会停顿(与用户线程并发)
    • 并发重置:重置CMS数据接口
  • 碎片化(标记-清理算法导致)
  • 影响用户程序
  • 无法处理浮动垃圾

Garbage First收集器 -XX:+UseG1GC 复制+标记整理

  • 并行和并发 多CPU
  • 分代收集
  • 空间整合(整体是标记-整理,局部Region是复制),不会有内存碎片
  • 可预测的停顿
  • 将整个java堆内存划分成多个大小相等的Region
  • 年轻代和老年代不再物理隔离

附录

JVM参数速查

参数 描述
-XX:+PrintGCDetail 在垃圾回收时打印内存回收日志
-Xms20M
-Xmx20M
-Xmn10M 指定新生代的堆大小
-XX:SurvivorRatio=8 指定新生代Eden区和Survivor区的空间比例,默认为8
-XX:MaxTenuringThreshold 到达这个年龄成为老年代
-XX:+PretenuerSizeThreshold (survivor区装不下的、新生成的大对象)也会到老年代
-XX:NewRatio 老年代和年轻代内存比例大小
-XX:ParallelGCThreads 限制垃圾收集线程数
-XX:MaxGCPauseMills 控制最大垃圾收集停顿时间(Parallel Scavenge收集器)
-XX:GCTimeRatio 设置吞吐量大小(Parallel Scavenge收集器)
-XX:+UseAdaptiveSizePolicy 不需要指定新生代大小,Eden和survivor比例
GC自适应(Parallel Scavenge收集器)
原文地址:https://www.cnblogs.com/CodingJacob/p/di2jiang-la-ji-shou-ji-qi.html