Java虚拟机对象探秘

一、对象的创建

1.类加载检查。虚拟机遇到new指令时，首先去检查指令的参数是否能在常量池中定位到一个类的符号引用，并检查这个符号引用的类是否已被加载、解析和初始化过。如果没有，那必须先执行相应的类加载过程。

2.为新生对象分配内存。（对象所需内存的大小在类加载完成后便可以完全确定）
内存分配方式：
- 指针碰撞分配方式：假设堆中的内存绝对规整（所有用过的内存放在一边，没用过的内存在另一边），中间放着一个指针作为分界点的指示器，那么分配内存其实就是指针向空闲那边挪动一段与对象大小相等的距离即可。
- 空闲列表分配方式：如果堆中的内存不是规整的，那就没办法用指针碰撞方式分配内存了。虚拟机需要维护一个列表，记录着哪些内存块是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的记录。
由此可以看出，采用那种分配方式，取决于堆中的内存是否规整，而堆内存是否规整又取决于垃圾收集器是否带有压缩整理功能决定的。
通常使用Serial、ParNew等带有Compact过程的收集器，使用指针碰撞分配方式。使用CMS这种基于Mark-Sweep算法的收集器时，通常使用空闲列表分配方式。

如何保证分配内存时的线程安全问题：
分配内存时需要修改指针位置，那么并发情况下是需要考虑线程安全问题的。
两种方案：

CAS，虚拟机采用CAS配上失败重试的方式保证更新操作的原子性；
本地线程分配缓冲（Thread Load Allocation Buffer, TLAB）。把内存分配的动作按照线程划分在不同的空间之中进行，即每个线程在Java堆中预先分配一小块内存。哪个线程需要分配内存，就在哪个线程的TLAB上分配，只有TLAB用完并分配新的TLAB时，才需要同步锁定。是否使用TLAB，通过 -XX:+/-UseTLAB 参数来设定；

3.将分配到的内存空间都初始化为零值（不包括对象头）。保证了对象的实例字段在Java代码中可以不赋初始值就直接使用，程序能访问这些字段对应的零值；

4.设置对象头（Object Header）。虚拟机对对象进行必要的设置，例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头中。

5.执行init方法。把对象按程序员的意愿进行初始化。这样一个真正可用的对象才算完全产生出来。

二、对象的内存布局

在HotSpot虚拟机中，对象在内存中存储的布局可以分为三个区域：对象头、实例数据、对齐填充（Padding）。

1.对象头包括两部分信息：

存储对象自身的运行时数据。如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等；（官方称它为“Mark Word”）
类型指针。即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例；

2.实例数据
实例数据部分是对象真正存储的有效信息，也是在程序代码中所定义的各种类型的字段内容。
无论是从父类继承下来的，还是子类中定义的，都需要记录下来

3.对齐填充
对齐填充并不是必然存在的，没有特别的含义，仅仅起到占位符的作用。HotSpot VM要求对象的起始地址是8字节的整数倍，而对象头正好是8字节的倍数（1或2倍），因此到实例数据部分没有对齐时，就使用对齐填充来补全。

三、对象的访问定位

创建对象是为了使用对象，我们的Java程序需要通过栈上的reference数据来操作堆上的具体对象。

那么这个引用通过何种方式去定位、访问堆中的具体位置呢？目前主流访问方式有两种：
1.使用句柄
使用句柄访问的话，Java堆将会划分一块内存池来作为句柄池，refrence中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自的具体地址。如下图所示：

2.使用直接指针
如果使用直接指针访问的话，Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息，reference中存储的直接就是对象地址，如果只是访问对象本身的话，就不需要多一次间接访问的开销。如下图所示：

使用直接指针来访问最大的好处就是速度更快，它节省了一次指针定位的时间开销，由于对象访问在Java中非常频繁，因此这类开销积少成多也是一项极为可观的执行成本。虚拟机HotSpot使用的就是直接指针方式。