Java内存模型和GC基础

1、java内存模型

　　1.1、运行时数据区分为五大块：

　　　　1、程序计数器，应对中断、时间片执行，记录当前执行到的字节码位置，以便后续继续执行；

　　　　2、虚拟机栈，即平时所谓的栈区，存储局部变量、动态链接、方法出口等；

　　　　3、本地方法栈，为native方法服务，基本同虚拟机栈，在Hotspot中虚拟机栈和本地方法栈被合并；

　　　　4、方法区，存储类加载信息、常量、静态变量、运行时常量池；

　　　　5、堆区，GC主要工作区，java中存放实例对象的地方。

　　综上，其实份三大部分，程序计数，栈区（服务java方法-虚拟机栈，服务native方法-本地方法栈），方法区-运行时数据，堆区-对象。

2、GC基础（针对hotspot）

　　2.1、判断对象死亡

　　1）引用计数算法（无主流虚拟机使用）：为对象添加引用计数器，每一个地方引用，计算加1，引用失效则减1，为了即不再使用。优点是实现简单，判定效率高，存在问题-无法解决对象间互相引用问题：

　　　　object A，B包含instance，

　　　　A.instance = B; // B_count = 1 , A_count = 1

　　　　B.instance = A;//B_count = 2, A_count = 2

　　　　A = null; //A_count = 1

　　　　B = null; //B_count = 1

　　A、B已经无法被引用到，但是计数仍然为1，无法被清除。

　　2）可达性分析：通过一系列GC Roots向下搜索，搜素路径即引用链，在搜索链上的可达，否则不可达。

　　　　GC Roots人群：1、虚拟机栈中引用对象，如局部变量；2、方法区中类的静态属性对象；3、方法区中常量引用对象；4、本地方法栈中Native方法引用对象。

　　　　引用分类：1、强引用，new出来的对象，GC不敢碰；

　　　　　　　　　2、软引用，有用但非必需，GC一般不碰，在要内存溢出时，会进行垃圾第二次回收，此时才会清除软引用，提供了SoftReference类（可用作缓存？）；

　　　　　　　　　3、弱引用，非必需对象，比软引用更软，活不过第二集就是他，在GC下次运行时，不管内存够不够都会被清理，提供WeakReference类；

　　　　　　　　　4、虚引用（幽灵引用、幻像引用），最弱。有他没他不影响对象生存时间，无法通过他得到对象实例，唯一作用：在被收集器回收时，会得到一个通知。提供PhantomReference类；

　　3）finalize()方法，GC可达性分析后，不在引用链上的对象，有一次执行finalze()方法自救的机会（仅执行一次），虚拟机判断有必要finalze()后，会把对象放入F-Queue队列中，并创建一个低优先级线程Finalizer去执行该方法。

　　4）提一下，方法区也有垃圾回收，即永久代的回收，如常量池无引用对象的回收。

　　2.2、垃圾收集算法

　　2.2.1 标记-清除算法：两个阶段，标记和清除；两个问题，效率和空间，标记算法和清除算法本身效率不高（循环遍历），另外清除后存在大量不连续内存碎片，分配较大对象时，无内存可用。

　　2.2.2 复制算法，基本思想：把内存分为两个部分，一部份用完了，就把已存活的对象依次复制到另一半上去。算法简单高效，也无碎片问题。缺点是费钱，好好的内存，利用率只有一半。

　　2.2.3 标记-整理算法：复制算法如果每次清理都有很多对象保留，那么复制一次到另一边的内存效率更低。针对这种情况，还是先标记，只是在清理时不是直接干掉无用对象，而是把存活对象向内存的一端移动，最后直接清理边界外的内存。　　　　　　　

　　2.3、年代划分

　　1）根据IBM研究，java中的对象98%时朝生夕死，所以死的比较快的区域叫新生代，新生代中一部分比较顽强在经历多次GC（hotspot默认15次）后还没被回收，就会被分入老年代。

　　正经讲就是java堆中，根据对象存活周期的不同，对象被分为新生代和老年代。根据这个特点垃圾收集也采用分代收集算法，复制算法效率高，但是复制对象成本高，适合新生代中在每次收集时大批对象死去，只需复制少量对象就可完成收集。而老年代对象成活率高，一般采用标记-清除，或者标记整理算法。

　　2）新生代延伸，上面说新生代采用复制算法，但是2.2.2中也说了复制算法空间利用率低。因此现在把新生代进一步划分：一块较大的Eden区，和两块较小的Survivor区。

　　因为在新生代空间，每次收集时，只会有少量对象存活，这样1：1划分使用空间和复制空间就没有意义。实际中新生代每次使用Eden和其中一块Survivor存储对象，垃圾收集时，再把存活的对象复制到另一块Survivor空间。Hotspot中两个区域的比例默认8：1，即每次新生代有80%+10%的内存空间存储新生代，只有10%被闲置。

　　3）上面90%使用率的情况适合于绝大多数对象回收场景，但是在某些情况下，一次垃圾回收时存活的对象超过了10%新生代空间，即一块Survivor空间不够用，这时只能依赖其他内存（老年代），新生代无法容纳的存活对象将直接进入老年代，这种行为即分配担保。

3、HotSpot算法实现

　　3.1、枚举根节点

　　即上文提到过的可达性分析，符合GC Roots条件的变量也太多（常量、类静态属性、本地变量表），因此引入了安全点的概念，Sefepoint会选取指令序列复用的的点（每条指令执行都很快，如果出现某些指令长时间执行，最明显的就是指令序列复用，如循环跳转、方法调用等）。可达性分析时就会从这些安全点来遍历。

　　另外要提的是-Stop The World! GC在进行可达性分析时，整个执行系统都会被暂停在一点上，因为一边进行对象引用关系分析，一遍还运行程序改变引用关系的话，就无从分析了。这个时GC卡顿的根源，也是各种垃圾收集器优化的重点。

　　3.2、垃圾收集器

　　to be continue!!!

参考：
　　1、https://blog.csdn.net/u011080472/article/details/51324422