深入理解Java虚拟机:第2章 Java内存区域与内存溢出异常

2.2 运行时数据区域

注:虚拟机规范(The Java Virtual Machine Specification, Java SE 8 Edition)Run-Time Data Areas

(1)程序计数器

线程私有。

当前线程所执行的字节码的行号指示器。如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值则为空(Undefined)。

(2)虚拟机栈

线程私有。

Java方法执行的内存模型:每个 Java 方法在执行的同时会创建一个栈帧用于存储局部变量表、操作数栈、常量池引用等信息。从方法调用直至执行完成的过程,就对应着一个栈帧在 Java 虚拟机栈中入栈和出栈的过程。局部变量表存放了编译期可知的基本数据类型、对象引用(reference类型)、returnAddress类型。

StackOverflowError异常(如果线程请求的栈深度大于虚拟机所允许的深度),OutOfMemoryError异常(如果虚拟机栈可以动态扩展, 扩展时无法申请到足够的内存)。

(3)本地方法栈

线程私有。

与虚拟机栈作用类似,为虚拟机使用到的native方法服务。

StackOverflowErrorOutOfMemoryError异常。

(4)Java堆

线程共享。

GC堆,存放对象实例和数组(对象数组、基本类型数组)。

如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。

现代的垃圾收集器基本都是采用分代收集算法,其主要的思想是针对不同类型的对象采取不同的垃圾回收算法,可以将堆分成两块:

  1. 新生代(Young Generation)主要是用来存放新生的对象。
  2. 老年代(Old Generation)主要存放应用程序中生命周期长的内存对象。

(5)方法区

线程共享。

存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码。

JDK 1.8 之前,HotSpot 虚拟机把它当成永久代来进行垃圾回收。但是很难确定永久代的大小,因为它受到很多因素影响,并且每次 Full GC 之后永久代的大小都会改变,所以经常会抛出 OutOfMemoryError 异常。

为了更容易管理方法区,从 JDK 1.8 开始,移除永久代,并把方法区移至元空间,它位于本地内存中,而不是虚拟机内存中。

注:HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区(Non-Heap)。

运行时常量池(Runtime Constant Pool

运行时常量池是方法区的一部分。

Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量(Literal,如文本字符串、 声明为final的常量值等)和符号引用(Symbolic References,类和接口的全限定名、字段的名称和描述符、方法的名称和描述符),这部分内容将在类加载后进入方法区的运行时常量池中存放。

  • Class文件常量池与运行时常量池的区别?
  1. Java虚拟机对Class文件每一部分(自然也包括常量池)的格式都有严格规定,每一个字节用于存储哪种数据都必须符合规范上的要求才会被虚拟机认可、装载和执行,但对于运行时常量池,Java虚拟机规范没有做任何细节的要求,不同的提供商实现的虚拟机可以按照自己的需要来实现这个内存区域。
  2. 运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用得比较多的便是String类的intern()方法。

2.3 HotSpot虚拟机对象探秘

2.3.1 对象的创建

  1. 虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、 解析和初始化过。 如果没有,那必须先执行相应的类加载过程。
  2. 在类加载检查通过后,接下来虚拟机将为新生对象分配内存。 对象所需内存的大小在类加载完成后便可完全确定。分配方式有“指针碰撞”(Serial、 ParNew)和“空闲列表”(CMS)。
  3. 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用TLAB,这一工作过程也可以提前至TLAB分配时进行。 这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
  4. 接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、 如何才能找到类的元数据信息、 对象的哈希码、 对象的GC分代年龄等信息。 这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前的运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
  5. 从虚拟机的视角来看,一个新的对象已经产生了,但从Java程序的视角来看,对象创建才刚刚开始,执行new指令之后会接着执行<init>方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

2.3.2 对象的内存布局

  1. 对象头(Header)
    a.Mark Word:用于存储对象自身的运行时数据,如哈希码(HashCode)、 GC分代年龄、 锁状态标志、 线程持有的锁、 偏向线程ID、 偏向时间戳等.
    b.类型指针:即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据。

  2. 实例数据(Instance Data)
    对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。存储顺序会受到虚拟机分配策略(longs/doubles、 ints、 shorts/chars、bytes/booleans、 oops)参数和字段在Java源码中定义顺序的影响。

  3. 对齐填充(Padding)
    不是必然存在,仅仅起着占位符的作用。HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,而对象头部分正好是8字节的倍数(1倍或者2倍)。

2.3.3 对象的访问定位

Java程序需要通过栈上的reference数据来操作堆上的具体对象。对象访问方式有“使用句柄”和“直接指针”。

  1. 使用句柄
  • Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据对象类型数据各自的具体地址信息。
  • 优点:对象被移动时(垃圾收集时很普遍)只会改变句柄中的实例数据指针,而reference本身不需要修改。

  1. 直接指针(Sun HotSpot默认)
  • Java堆对象的布局中就必须考虑如何放置访问对象类型数据的相关信息,而reference中存储的直接就是对象地址。
  • 优点:速度更快,节省了一次指针定位的时间开销。

《深入理解Java虚拟机》目录

原文地址:https://www.cnblogs.com/zengzhihua/p/9708519.html