垃圾收集算法

【根搜索算法】

这个算法的基本思路是：对任何“活”的对象，一定能最终追溯到其存活在堆栈或静态存储区之中的引用。

可以作为根的对象

- 虚拟机栈（栈桢中的本地变量表）中的引用的对象。

- 方法区中的类静态属性引用的对象。

- 方法区中的常量引用的对象。

- 本地方法栈中JNI的引用的对象。

方法区是jvm的一块内存区域，用来存放类相关的信息。很明显，java中单例模式创建的对象被自己类中的静态属性所引用，符合第二条，因此，单例对象不会被jvm垃圾收集。

classSingleton {

privatebyte[] a = newbyte[6*1024*1024];

privatestaticSingleton singleton = newSingleton();

privateSingleton(){}

publicstaticSingleton getInstance(){

returnsingleton;

}

虽然jvm堆中的单例对象不会被垃圾收集，但是单例类本身如果长时间不用会不会被收集呢？因为jvm对方法区也是有垃圾收集机制的。如果单例类被收集，那么堆中的对象就会失去到根的路径，必然会被垃圾收集掉。对此，笔者查阅了hotspot虚拟机对方法区的垃圾收集方法，jvm卸载类的判定条件如下：

- 该类所有的实例都已经被回收，也就是java堆中不存在该类的任何实例。

- 加载该类的ClassLoader已经被回收。

- 该类对应的java.lang.Class对象没有任何地方被引用，无法在任何地方通过反射访问该类的方法。

垃圾收集算法，垃圾收集器的特点和工作原理，内存动态分配与回收策略

哪些内存需要回收、什么时候回收、如何回收。

程序计数器+虚拟机栈+本地方法栈：随线程而生随线程而灭。方法或线程结束时，内存自然就跟随着回收了。

而Java堆和方法区则不一样。这部分内存的分配和回收都是动态的。垃圾收集器所关注的是这部分内存。

3.2 对象已死吗？

3.2.1 引用计数算法

COM（Component Object Model）技术、使用ActionScript 3 的FlashPlayer、Python语言以及游戏脚本领域中被广泛应用的Squirrel中使用了引用计数算法进行内存管理。

Java语言没有选用引用计数方法，因为很难解决对象之间的相互循环引用的问题。

3.2.2 根搜索算法（可达性分析算法）

Java、C#、Lisp

这个算法的基本思路：通过一系列的名为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，搜索所走过的路径称为引用链（Reference Chain）当一个对象到GC Roots没有任何引用链相连时，则证明此对象是不可用的。

3.2.3 再谈引用

3.2.5 回收方法区

永久代的垃圾收集主要回收两部分内容：废弃常量和无用的类。

3.3 垃圾收集算法

3.3.1 标记-清除算法

最基础的收集算法：首先标记，然后再清除。

主要缺点有两个：

一：效率问题；

二：空间问题，会产生大量不连续的内存碎片，空间碎片太多可能会导致，当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

3.2.2 复制算法

为了解决效率问题，将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另一块上面。

然后再把已使用过的内存空间一次清理掉。

3.3.3 标记-整理算法【老年代】

3.3.4 分代收集算法

当前商业虚拟机的垃圾收集都采用"分代收集"算法。新生代：复制算法，只需要少量存活对象的复制成本。老年代：使用“标记-整理”或者“标记-清理”算法。

3.5 垃圾收集器：内存回收的具体实现

JDK1.7的HotSpot虚拟机，正式提供了商用的G1收集器。

HotSpot实现了七中作用于不同分代的收集器。直到现在为止还没有最好的收集器出现，更加没有万能的收集器。我们选择的只是对具体应用最合适的收集器。重点分析CMS和G1这两款相对复杂的收集器，了解运作细节。

3.5.1 Serial收集器

暂停所有其他工作线程。

3.5.2 ParNew收集器

Serial收集器的多线程版本。除了Serial收集器外，目前只有它能与CMS收集器配合工作。

3.5 内存分配与回收策略 P86

自动内存管理：

1.给对象分配内存；

2.回收分配给对象的内存。

对象内存分配：

几条普遍的内存分配原则：

3.5.1 对象优先在Eden分配

大多数情况下，对象在新生代Eden区中分配。

3.5.2 大对象直接进入老年代

3.5.3 长期存活的对象将进入老年代

3.5.4 动态对象年龄判定

3.5.5 空间分配担保 P94

第3章小结（垃圾收集器 + 内存分配）

基本回收算法

1. 引用计数（Reference Counting）

比较古老的回收算法。原理是此对象有一个引用，即增加一个计数，删除一个引用则减少一个计数。垃圾回收时，只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。

2. 标记-清除（Mark-Sweep）

此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象，第二阶段遍历整个堆，把未标记的对象清除。此算法需要暂停整个应用，同时，会产生内存碎片。

3. 复制（Copying）

此算法把内存空间划为两个相等的区域，每次只使用其中一个区域。垃圾回收时，遍历当前使用区域，把正在使用中的对象复制到另外一个区域中。次算法每次只处理正在使用中的对象，因此复制成本比较小，同时复制过去以后还能进行相应的内存整理，不过出现“碎片”问题。当然，此算法的缺点也是很明显的，就是需要两倍内存空间。

4. 标记-整理（Mark-Compact）

此算法结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段，第一阶段从根节点开始标记所有被引用对象，第二阶段遍历整个堆，把清除未标记对象并且把存活对象“压缩”到堆的其中一块，按顺序排放。此算法避免了“标记-清除”的碎片问题，同时也避免了“复制”算法的空间问题。

5. 增量收集（Incremental Collecting）

实施垃圾回收算法，即：在应用进行的同时进行垃圾回收。不知道什么原因JDK5.0中的收集器没有使用这种算法的。

6. 分代（Generational Collecting）

基于对对象生命周期分析后得出的垃圾回收算法。把对象分为年青代、年老代、持久代，对不同生命周期的对象使用不同的算法（上述方式中的一个）进行回收。现在的垃圾回收器（从J2SE1.2开始）都是使用此算法的。

三、GC类型

GC有两种类型：Scavenge GC和Full GC。

1. Scavenge GC

一般情况下，当新对象生成，并且在Eden申请空间失败时，就好触发Scavenge GC，堆Eden区域进行GC，清除非存活对象，并且把尚且存活的对象移动到Survivor区。然后整理Survivor的两个区。

2. Full GC

对整个堆进行整理，包括Young、Tenured和Perm。Full GC比Scavenge GC要慢，因此应该尽可能减少Full GC。有如下原因可能导致Full GC：

* Tenured被写满

* Perm域被写满

* System.gc()被显示调用

* 上一次GC之后Heap的各域分配策略动态变化

四、垃圾回收器

目前的收集器主要有三种：串行收集器、并行收集器、并发收集器。

1. 串行收集器

使用单线程处理所有垃圾回收工作，因为无需多线程交互，所以效率比较高。但是，也无法使用多处理器的优势，所以此收集器适合单处理器机器。当然，此收集器也可以用在小数据量（100M左右）情况下的多处理器机器上。可以使用-XX:+UseSerialGC打开。

2. 并行收集器

1). 对年轻代进行并行垃圾回收，因此可以减少垃圾回收时间。一般在多线程多处理器机器上使用。使用-XX:+UseParallelGC.打开。并行收集器在J2SE5.0第六6更新上引入，在Java SE6.0中进行了增强--可以堆年老代进行并行收集。如果年老代不使用并发收集的话，是使用单线程进行垃圾回收，因此会制约扩展能力。使用-XX:+UseParallelOldGC打开。

2). 使用-XX:ParallelGCThreads=<N>设置并行垃圾回收的线程数。此值可以设置与机器处理器数量相等。

3). 此收集器可以进行如下配置：

* 最大垃圾回收暂停:指定垃圾回收时的最长暂停时间，通过-XX:MaxGCPauseMillis=<N>指定。<N>为毫秒.如果指定了此值的话，堆大小和垃圾回收相关参数会进行调整以达到指定值。设定此值可能会减少应用的吞吐量。

* 吞吐量:吞吐量为垃圾回收时间与非垃圾回收时间的比值，通过-XX:GCTimeRatio=<N>来设定，公式为1/（1+N）。例如，-XX:GCTimeRatio=19时，表示5%的时间用于垃圾回收。默认情况为99，即1%的时间用于垃圾回收。

3. 并发收集器

可以保证大部分工作都并发进行（应用不停止），垃圾回收只暂停很少的时间，此收集器适合对响应时间要求比较高的中、大规模应用。使用-XX:+UseConcMarkSweepGC打开。

1). 并发收集器主要减少年老代的暂停时间，他在应用不停止的情况下使用独立的垃圾回收线程，跟踪可达对象。在每个年老代垃圾回收周期中，在收集初期并发收集器会对整个应用进行简短的暂停，在收集中还会再暂停一次。第二次暂停会比第一次稍长，在此过程中多个线程同时进行垃圾回收工作。

2). 并发收集器使用处理器换来短暂的停顿时间。在一个N个处理器的系统上，并发收集部分使用K/N个可用处理器进行回收，一般情况下1<=K<=N/4。

3). 在只有一个处理器的主机上使用并发收集器，设置为incremental mode模式也可获得较短的停顿时间。

4). 浮动垃圾：由于在应用运行的同时进行垃圾回收，所以有些垃圾可能在垃圾回收进行完成时产生，这样就造成了“Floating Garbage”，这些垃圾需要在下次垃圾回收周期时才能回收掉。所以，并发收集器一般需要20%的预留空间用于这些浮动垃圾。

5). Concurrent Mode Failure：并发收集器在应用运行时进行收集，所以需要保证堆在垃圾回收的这段时间有足够的空间供程序使用，否则，垃圾回收还未完成，堆空间先满了。这种情况下将会发生“并发模式失败”，此时整个应用将会暂停，进行垃圾回收。

6). 启动并发收集器：因为并发收集在应用运行时进行收集，所以必须保证收集完成之前有足够的内存空间供程序使用，否则会出现“Concurrent Mode Failure”。通过设置-XX:CMSInitiatingOccupancyFraction=<N>指定还有多少剩余堆时开始执行并发收集

4. 小结

* 串行处理器：

--适用情况：数据量比较小（100M左右）；单处理器下并且对响应时间无要求的应用。

--缺点：只能用于小型应用

* 并行处理器：

--适用情况：“对吞吐量有高要求”，多CPU、对应用响应时间无要求的中、大型应用。举例：后台处理、科学计算。

--缺点：应用响应时间可能较长

* 并发处理器：

--适用情况：“对响应时间有高要求”，多CPU、对应用响应时间有较高要求的中、大型应用。举例：Web服务器/应用服务器、电信交换、集成开发环境。