java GC 垃圾回收简述

什么是垃圾？

没有引用指向的对象都是垃圾

垃圾.png

如何判定垃圾？

1.引用计数法（ReferenceCount）

所谓引用计数法就是给每一个对象设置一个引用计数器，每当有一个地方引用这个对象时，就将计数器加一，引用失效时，计数器就减一。当一个对象的引用计数器为零时，说明此对象没有被引用，也就是“死对象”,将会被垃圾回收.
引用计数法有一个缺陷就是无法解决循环引用问题，也就是说当对象A引用对象B，对象B又引用者对象A，那么此时A,B对象的引用计数器都不为零，也就造成无法完成垃圾回收，所以主流的虚拟机都没有采用这种算法。

引用计数法.png

2.根可达算法(RootSearching)

从一个被称为GC Roots的对象开始向下搜索，如果一个对象到GC Roots没有任何引用链相连时，则说明此对象不可用。
在java中可以作为GC Roots的对象有以下几种:
-虚拟机栈中引用的对象
-方法区类静态属性引用的对象
-方法区常量池引用的对象
-本地方法栈JNI引用的对象
虽然这些算法可以判定一个对象是否能被回收，但是当满足上述条件时，一个对象比不一定会被回收。当一个对象不可达GC Root时，这个对象并不会立马被回收，而是出于一个死缓的阶段，若要被真正的回收需要经历两次标记如果对象在可达性分析中没有与GC Root的引用链，那么此时就会被第一次标记并且进行一次筛选，筛选的条件是是否有必要执行finalize()方法。当对象没有覆盖finalize()方法或者已被虚拟机调用过，那么就认为是没必要的。
如果该对象有必要执行finalize()方法，那么这个对象将会放在一个称为F-Queue的对队列中，虚拟机会触发一个Finalize()线程去执行，此线程是低优先级的，并且虚拟机不会承诺一直等待它运行完，这是因为如果finalize()执行缓慢或者发生了死锁，那么就会造成F-Queue队列一直等待，造成了内存回收系统的崩溃。GC对处于F-Queue中的对象进行第二次被标记，这时，该对象将被移除”即将回收”集合，等待回收。

根可达算法.png

常见的垃圾回收算法

1.标记清除(mark sweep) -效率不高，有碎片，两次扫描

这是垃圾收集算法中最基础的，根据名字就可以知道，它的思想就是标记哪些要被回收的对象，然后统一回收。这种方法很简单，但是会有两个主要问题：1.效率不高，标记和清除的效率都很低；2.会产生大量不连续的内存碎片，经过两遍扫描，导致以后程序在分配较大的对象时，由于没有充足的连续内存而提前触发一次GC动作。适合存活对象较多的情况。

标记清除.png

2.拷贝算法 (copying) - 没有碎片，浪费空间

为了解决效率问题，复制算法将可用内存按容量划分为相等的两部分，然后每次只使用其中的一块，当一块内存用完时，就将还存活的对象复制到第二块内存上，然后一次性清楚完第一块内存，再将第二块上的对象复制到第一块。但是这种方式，内存的代价太高，每次基本上都要浪费一般的内存。
于是将该算法进行了改进，内存区域不再是按照1：1去划分，而是将内存划分为8:1:1三部分，较大那份内存交Eden区，其余是两块较小的内存区叫Survior区。每次都会优先使用Eden区，若Eden区满，就将对象复制到第二块内存区上，然后清除Eden区，如果此时存活的对象太多，以至于Survivor不够时，会将这些对象通过分配担保机制复制到老年代中。(java堆又分为新生代和老年代)适合存活对象较少的情况。

拷贝.png

3.标记压缩(mark compact) - 没有碎片，效率偏低（两遍扫描，指针需要调整）

该算法主要是为了解决标记-清除，产生大量内存碎片的问题；当对象存活率较高时，也解决了复制算法的效率问题。它的不同之处就是在清除对象的时候现将可回收对象移动到一端，然后清除掉端边界以外的对象，这样就不会产生内存碎片了。

标记压缩.png

4.分代收集（JVM内存分代模型）

现在的虚拟机垃圾收集大多采用这种方式，它根据对象的生存周期，将堆分为新生代和老年代。在新生代中，由于对象生存期短，每次回收都会有大量对象死去，那么这时就采用复制算法。老年代里的对象存活率较高，没有额外的空间进行分配担保，所以可以使用标记-整理或者标记-清除。新生代和老年代空间比例是1：2

堆内存逻辑分区.png

1.部分垃圾回收器使用的模型

除Epsilon ZGC Shenandoah之外的GC都是使用逻辑分代模型
G1是逻辑分代，物理不分代
除此之外不仅逻辑分代，而且物理分代

2.新生代 + 老年代 + 永久代（1.7）Perm Generation/ 元数据区(1.8) Metaspace

永久代元数据 - Class
永久代必须指定大小限制，元数据可以设置，也可以不设置，无上限（受限于物理内存）
字符串常量 1.7 - 永久代，1.8 - 堆
MethodArea逻辑概念 - 永久代、元数据

3.新生代 = Eden + 2个suvivor区

YGC回收之后，大多数的对象会被回收，活着的进入s0
再次YGC，活着的对象eden + s0 -> s1
再次YGC，eden + s1 -> s0
年龄足够 -> 老年代（15 CMS 6）
s区装不下 -> 老年代

4.老年代

顽固分子
老年代满了FGC Full GC

5.GC Tuning (Generation)

尽量减少FGC
MinorGC = YGC
MajorGC = FGC

6.对象分配过程

栈上分配
-线程私有小对象
-无逃逸
-支持标量替换
-无需调整
线程本地分配TLAB（Thread Local Allocation Buffer）
-占用Eden，默认1%
-多线程的时候不用竞争Eden就可以申请空间，提高效率
-小对象
-无需调整
老年代
-大对象
Eden

对象分配过程.png

7.Minor GC/YGC和Major GC/FULLGC

当Eden区没有足够的空间进行分配时，虚拟机会执行一次Minor GC.Minor Gc通常发生在新生代的Eden区，在这个区的对象生存期短，往往发生Gc的频率较高，回收速度比较快;Full Gc/Major GC 发生在老年代，一般情况下，触发老年代GC的时候不会触发Minor GC,但是通过配置，可以在Full GC之前进行一次Minor GC这样可以加快老年代的回收速度。

java的四种引用

1.强引用 NomerReference

如果一个对象具有强引用，它就不会被垃圾回收器回收。即使当前内存空间不足，JVM也不会回收它，而是抛出 OutOfMemoryError 错误，使程序异常终止。如果想中断强引用和某个对象之间的关联，可以显式地将引用赋值为null，这样一来的话，JVM在合适的时间就会回收该对象

应用：默认的引用就是强引用。

2.软引用 SoftReference

在使用软引用时，如果内存的空间足够，软引用就能继续被使用，而不会被垃圾回收器回收，只有在内存不足时，软引用才会被垃圾回收器回收。

应用：适合做缓存

3.弱引用 WeakReference

具有弱引用的对象拥有的生命周期更短暂。因为当 JVM 进行垃圾回收，一旦发现弱引用对象，无论当前内存空间是否充足，都会将弱引用回收。不过由于垃圾回收器是一个优先级较低的线程，所以并不一定能迅速发现弱引用对象。

应用：典型应用就是ThreadLocal

ThreadLocal tl = new ThreadLocal();

tl.set(new F());

tl.remove;

上面代码中，tl是一个强引用，set方法的源码如下：

通过阅读ThreadLocal的源码得知，set方法会将参数值存进一个ThreadLocalMap对象。ThreadLocalMap是Thread的一个局部变量。

也就是说在这个Thread内部有两个引用，一个tl强引用指向ThreadLocal对象，一个map指向ThreadLocalMap，map的key值通过一个弱引用指向ThreadLocal，value值是set方法的参数。

当tl的强引用消失的时候，若key的引用是强引用，则ThreadLocal就永远不会回收。这样会有内存泄漏的风险。

可是当tl的应用消失了，key的引用也消失了，但是key值指向了一个null值，那么当map存在的时候这个键值对会一直存在，还是有内存泄漏的风险。所以，ThreadLocal里面的对象不用了，一点过调用remove方法。

4.虚引用 PhantomReference

顾名思义，就是形同虚设，如果一个对象仅持有虚引用，那么它相当于没有引用，在任何时候都可能被垃圾回收器回收。