java内存模型与线程

一、概述

　　在我们的服务器日常工作中，由于计算机CPU的运算速度和计算机内存的存储速度以及通信速度的差距太大，大量的时间都花费在磁盘的I/O、网络通信上，这样处理器的大部分时间都处于等待其他资源的状态，就造成了大量的CPU资源浪费。

衡量一个服务性能的好坏的重要指标之一就是每秒事务处理数（Transactions Per Seconds, TPS），它代表了一秒内服务端平均能响应的请求总数。

二、硬件的效率与一致性

　　物理机遇到的并发问题与虚拟机中的情况有不少相似之处，物理机对并发的处理方案对于虚拟机的实现也有相当大的意义。

　　由于计算机的储存设备与处理器的运算速度之间有几个数量级的差距，所以现代计算机系统都不得不加入一层读写速度尽可能与处理器速度接近的高速缓存（Cache）来作为内存与处理器之间的缓冲：将运算需要使用的数据复制到缓存中，让运算能快速进行，当

运算结束后再从缓存同步回内存中，这样处理器就无须等待缓慢的内存读写了。

　　高速缓存的引入很好的解决了内存与处理器之间的速度矛盾，但是也引入了一个新的问题：缓存一致性（Cache Coherence）。在多处理器的系统中，每个处理器都有自己的高速缓存，如果高速缓存在操作同一个数据，就会导致各个高速缓存中的数据不一致的问题。

为了解决一致性的问题，就需要各个处理器在访问缓存时都遵循一些协议，如MSI，MESI，Firefly及Dragon Protocol 等。

三、Java的内存模型

　　1、java虚拟机规范中定义的java内存模型（Java Memory Model ，JMM）来屏蔽掉各种硬件和操作系统的内存访问差异，以实现让Java程序在各个平台下都能达到一致的内存访问效果。所以在考虑java线程安全问题时只需要考虑JMM而不需要考虑硬件影响。

　　通过上图可知，java内存模型规定了所有的变量（并非java编程中所说的变量，它不包括局部变量）都存储在主内存中，每条线程还有自己的工作内存。线程对变量的所有操作（读取、赋值等）都必须在工作内存中进行，而不能直接读写主内存中的变量。不同的线程间也无法直接访问彼此工作单位内存中的变量，线程间变量值的传递均需要通过主内存来完成。这里所说的主内存和工作内存和前面的java虚拟机内存划分并不在同一个层次，二者没有关系。

　　2、内存间交互操作

　　关于主内存和工作内存之间具体的交互协议，即一个变量如何从主内存中拷贝到工作内存、如何从工作内存中同步回主内存之类的具体细节。java内存定义了以下8种操作来完成，虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的（对于double和long类型的变量来说，load、store、read和write操作在某些平台允许有例外）。

　　　　2.1、lock（锁定）：作用于主内存的变量，它把一个变量标识为一条线程独占的状态。

　　　　2.2、unlock（解锁）：作用于主内存的变量，它把一个变量从锁定状态释放出来，解锁后的变量才能被其他线程锁定。

　　　　2.3、read（读取）：作用于主内存的变量，它把一个变量从主内存传输到线程的工作内存，以便后面的load使用。

　　　　2.4、load（载入）：作用于工作内存的变量，它把read操作的得到的变量值放入工作内存的变量副本中。

　　　　2.5、use（使用）：作用于工作内存的变量，每当虚拟机遇到一个使用到变量的指令时都会使用该指令。

　　　　2.6、assign（赋值）：作用于工作内存的变量，把一个从执行引擎接收到的值赋给工作内存中的变量，每当虚拟机遇到一个给变量赋值的指令时，都要使用该操作。

　　　　2.7、store（储存）：作用于工作内存的变量，把工作内存中的一个变量的值传递给主内存，以便随后的write操作。

　　　　2.8、write（写入）：作用于工作内存的变量，把store操作从工作内存中得到的变量的值写入主内存中的变量。

　　　　特点：

　　　　　　read和load、store和write必须顺序执行，但不保证连续性，即read和load中间可能会插入其他操作。如read a、read b、load a、load b。

　　　　　　不允许read和load、store和write操作之一单独出现，即不允许一个变量从主内存读取了但工作内存不接受，或者从工作内存发起回写了但主内存不接受的情况。

　　　　　　不允许一个线程丢弃它的最近assign操作，即变量在工作内存中改变了之后必须把该变化同步回主内存。

　　　　　　不允许一个线程无原因的（没有发生过任何assign操作）把数据从线程的工作内存同步回主内存中。

　　　　　　一个新的变量只能在主内存中“诞生”，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量，就是对一个变量执行use和store之前必须先执行过了assign和load操作。

　　　　　　一个变量在同一个时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。

　　　　　　如果对一个变量执行lock操作，僵尸清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行load或assign操作初始化变量的值。

　　　　　　如果一个变量事先没有被lock操作锁定，则不允许对它执行unlock操作，也不允许去unlock一个被其他线程锁定住的变量。

　　　　　　对一个变量执行unlock操作之前，必须先把此变量同步回主内存中（执行store和write操作）。

四、原子性、可见性和有序性

　　1、原子性：由于Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write，我们大致可以认为基本数据类型的访问读写具备原子性（long和double可能会有例外）。如果应用场景需要一个更大范围的原子性保证，Java内存模型还提供了lock和unlock操作来满足需求，尽管虚拟机未把lock和unlock操作直接开放给用户，但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作，这两个字节码指令反应到Java代码中就是同步块——synchronized关键字，因此在synchronized块之间的操作也具备原子性。

　　　　1.1、Java中的原子操作包括：

　　　　　　除long和double之外的基本类型的赋值操作

　　　　　　所有引用reference的赋值操作

　　　　　　java.concurrent.Atomic.* 包中所有类的一切操作。

　　2、可见性：指当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。除了volatile，Java还有两个关键字能实现可见性，synchronized和final。同步块的可见性是由“对一个变量执行unlock操作之前，必须把此变量同步回主内存中（执行store和write操作）”这条规则获得的，而final关键字的可见性是指：被final修饰的字段在构造器中一旦被初始化完成，并且构造器没有把“this”的引用传递出去（this引用逃逸是一件很危险的事情，其他线程有可能通过这个引用访问到“初始化了一半”的对象），那么其他线程中就能看见final字段的值。

　　3、有序性：在Java内存模型中，允许编译器和处理器对指令进行重排序，但是重排序过程不会影响到单线程程序的执行，却会影响到多线程并发执行的正确性。Java程序中天然的有序性可以总结为一句话：如果在本线程内观察，所有的操作都是有序的；如果在一个线程中观察另外一个线程，所有的操作都是无序的。前半句是指“线程内表现为串行的语义”（Within-Thread As-if-Serial Semantics），后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性，volatile关键字本身就包含了禁止指令重排序的语义，而synchronized则是由“一个变量在同一时刻只允许一条线程对其进行lock操作”这条规则获得的，这个规则决定了持有同一个锁的两个同步块只能串行地进入。

　　3.1、如果Java内存中所有的有序性都是依靠volatile和synchronized来完成，那么有一些操作将会变得很繁琐。但是Java语言中有一个“先行发生”的原则。

　　　　先行发生原则：在Java内存模型中定义了两项操作顺序之间的偏序关系，如果操作A先行发生于操作B，其实就是说在发生操作B之前，操作A产生的影响能被操作B观察到，“影响”包括修改了内存中共享变量的值，发送了消息，调用了方法等。

　　　　Java内存中包括下列一些天生发生的先行发生关系：

　　　　程序次序执行规则：在一个线程内，按照代码顺序执行，书写在前面的操作先行发生于书写在后面的操作。

　　　　管程锁定规则：一个unlock操作先行发生于后面（时间上的先后）对同一个锁的lock操作。

　　　　volatile变量规则：对于一个volatile变量的写操作先行发生于后面对这个变量的读操作。

　　　　线程启动规则：Thread对象的start()方法先行发生于此线程的每一个动作。

　　　　线程终止规则：线程的所有操作都先行发生于对此线程的终止操作

　　　　线程中断规则：对线程interrupt（）方法的调用先行发生于被中断线程的代码检测到中断时间的发生。

　　　　对象终结规则：一个对象的初始化完成先行发生于它的finalize（）方法的开始。

　　　　传递性：若A先行于B发生，B先行于C，那么得出A先行于C

五、java线程

　　1、线程是比进程更轻量级的调度执行单位，在linux里面，线程和进程没有什么区别，唯一的就是在地址空间，线程的切换虚拟内存空间依然是相同的，但是进程切换是不同的。目前主流的操作系统都提供的线程实现，java则提供的线程实现方法都是native的，因为不同的硬件和操作系统提供线程调度方式并不尽相同，所以java没用采用和平台无关的统一手段来实现。

　　2、实现线程的主要3种方式:使用内核线程实现，使用用户线程实现，使用用户线程加轻量级进程混合实现。

　　　　2.1、内核线程实现：直接由操作系统内核支持的线程，这种线程由内核来完成线程切换。程序一般不会直接使用内核线程，而是去使用内核线程的一种高级接口—轻量级进程（LWP），轻量级进程就是我们所讲的线程，这种轻量级进程与内核线程之间1：1的对应关系。

　　　　　　2.1.1、优点：内核直接支持，由操作系统内核创建和撤销。内核维护进程及线程的上下文信息以及线程切换。一个内核线程由于I/O操作而阻塞，不会影响其它线程的运行。

　　　　　　2.1.2、缺点：线程的操作、创建、同步等都需要系统调用，而系统调用代价比较高，需要在用户态和内核态中来回切换。每个轻量级的进程都需要一个内核线程来支持，需要消耗一定的内核资源。

　　　　2.2、用户线程实现：用户线程指不需要内核支持而在用户程序中实现的线程，其不依赖于操作系统核心，应用进程利用线程库提供创建、同步、调度和管理线程的函数来控制用户线程。不需要用户态/核心态切换，速度快，操作系统内核不知道多线程的存在，因此一个线程阻塞将使得整个进程（包括它的所有线程）阻塞。使用用户线程实现的程序一般都比较复杂。

　　　　　　2.2.1、优点：切换由用户态程序自己控制内核切换,不需要内核干涉，少了进出内核态的消耗。

　　　　　　2.2.2、缺点：多核处理器很难讲线程映射到其他处理器上，单线程阻塞会造成该进程阻塞。

　　　　2.3、用户线程加轻量级进程混合实现：这种混合模式下，既存在用户线程，也存在轻量级进程。用户线程还是完全建立在用户空间中，因此用户线程的创建、切换、析构等依然廉价，可以支持大规模的用户线程并发。操作系统提供支持的轻量进程作为用户线程和内核线程之间的桥梁，用户线程的系统调用要通过轻量级线程来完成，大大降低了进程阻塞的风险。用户线程和轻量级进程比是N:M多对对的关系。

　　3、java的线程实现

　　　　在jdk1.2之前是基于用户线程去实现的，但是后面就放弃了。因此在目前的jdk版本中， java虚拟的线程是如何映射的和平台相关，也和java虚拟机的具体实现有关，对于Sun JDK来说，它的Windows版和linux版都是使用一对一的线程模型实现的，一条java线程就映射到一条轻量级进程中，因为windows和linux系统提供的线程模型都是一对一的。

六、java线程调度

　　线程调度是指系统为线程分配处理器使用权的过程。主要调度方式两种：

　　1、使用协同调度的多线程系统，线程执行时间由线程本身控制，线程把自己的工作执行完后，要主动通知系统切换到另外一个线程上去。优点：实现简单。缺点：执行时间不可控制。

　　2、使用抢占调用的多线程系统，每个线程由系统分配执行时间，线程的切换不由线程本身决定。Java使用的就是这种线程调度方式。