计算机组成原理9-CPU组成、缓存、内存

1、存储器(原文)

　　SRAM：CPU 高速缓存。只要处在通电状态，里面的数据就可以保持存在。而一旦断电，里面的数据就会丢失了。电路简单，访问速度快。

　　DRAM：动态随机存取存储器，密度更高，容量更大。

　　存储器的层级结构：

　　从 Cache、内存，到 SSD 和 HDD 硬盘，一台现代计算机中，就用上了所有这些存储器设备。其中，容量越小的设备速度越快，而且，CPU 并不是直接和每一种存储器设备打交道，而是每一种存储器设备，只和它相邻的存储设备打交道。比如，CPU Cache 是从内存里加载而来的，或者需要写回内存，并不会直接写回数据到硬盘，也不会直接从硬盘加载数据到 CPU Cache 中，而是先加载到内存，再从内存加载到 Cache 中。
　　这样，各个存储器只和相邻的一层存储器打交道，并且随着一层层向下，存储器的容量逐层增大，访问速度逐层变慢，而单位存储成本也逐层下降，也就构成了存储器层次结构。

2、局部性原理(原文)

　　缓存：服务端系统遇到的第一个性能瓶颈，往往就发生在访问数据库的时候。使用“缓存”，通过使用 Redis 或者 Memcache 这样的开源软件，在数据库前面提供一层缓存的数据，来缓解数据库面临的压力，提升服务端的程序性能。

　局部性原理：CPU 速度快，但造价高。存储速度慢，但造价低。既享受 CPU Cache 的速度，又享受内存、硬盘巨大的容量和低廉的价格。

　　时间局部性：将用户的个人信息，从存储在硬盘的数据库读取到内存的缓存中来。

　　空间局部性:如果一个数据被访问了，那么和它相邻的数据也很快会被访问。在存储数据的时候，数组内的多项数据会存储在相邻的位置。加载的时候，也会一并加载。

　有了时间局部性和空间局部性，我们不用再把所有数据都放在内存里，也不用都放在 HDD 硬盘上，而是把访问次数多的数据，放在贵但是快一点的存储器里，把访问次数少的数据，放在慢但是大一点的存储器里。这样组合使用内存、SSD 硬盘以及 HDD 硬盘，使得我们可以用最低的成本提供实际所需要的数据存储、管理和访问的需求。如何进行存储器的硬件规划。你需要考虑硬件的成本、访问的数据量以及访问的数据分布，然后根据这些数据的估算，来组合不同的存储器，能用尽可能低的成本支撑所需要的服务器压力。

3、高速缓存(原文)

　　CPU运转速度快，但是内存运转速度慢。运行程序的时间主要花在了将对应的数据从内存中读取出来，加载到 CPU Cache 里。CPU 从内存中读取数据到 CPU Cache 的过程中，是一小块一小块来读取数据的，而不是按照单个数组元素来读取数据的。这样一小块一小块的数据，在 CPU Cache 里面，叫作 Cache Line（缓存块）。现代 CPU 进行数据读取的时候，无论数据是否已经存储在 Cache 中，CPU 始终会首先访问 Cache。只有当 CPU 在 Cache 中找不到数据的时候，才会去访问内存，并将读取到的数据写入 Cache 之中。当时间局部性原理起作用后，这个最近刚刚被访问的数据，会很快再次被访问。而 Cache 的访问速度远远快于内存，这样，CPU 花在等待内存访问上的时间就大大变短了。

4、MESI协议(原文)

　　[1]缓存一致性问题

　　某个数据，1号核心刚刚更新过，这个更新的信息，只出现在 1 号核心的 L2 Cache 里，而没有出现在 2 号核心的 L2 Cache 或者主内存里面。这个问题，就是所谓的缓存一致性问题，1 号核心和 2 号核心的缓存，在这个时候是不一致的。

　　解决方式：

　　第一点叫写传播（Write Propagation）。写传播是说，在一个 CPU 核心里，我们的 Cache 数据更新，必须能够传播到其他的对应节点的 Cache Line 里。

　　第二点叫事务的串行化（Transaction Serialization），事务串行化是说，我们在一个 CPU 核心里面的读取和写入，在其他的节点看起来，顺序是一样的。

　　[2] MESI协议

　　总线嗅探：解决的是多个 CPU 核心之间的数据传播问题。本质上就是把所有的读写请求都通过总线（Bus）广播给所有的 CPU 核心，然后让各个核心去“嗅探”这些请求，再根据本地的情况进行响应。

　　MESI 协议：一种写失效（Write Invalidate）的协议。在写失效协议里，只有一个 CPU 核心负责写入数据，其他的核心，只是同步读取到这个写入。在这个 CPU 核心写入 Cache 之后，它会去广播一个“失效”请求告诉所有其他的 CPU 核心。其他的 CPU 核心，只是去判断自己是否也有一个“失效”版本的 Cache Block，然后把这个也标记成失效的就好了。与之对应的写广播（Write Broadcast）协议。在那个协议里，一个写入请求广播到所有的 CPU 核心，同时更新各个核心里的 Cache。

5、内存（原文）

　　想要把虚拟内存地址，映射到物理内存地址，最直观的办法，就是来建一张映射表。这个映射表，能够实现虚拟内存里面的页，到物理内存里面的页的一一映射。这个映射表，在计算机里面，就叫作页表（Page Table）。

　　一个内存地址转换，其实就是这样三个步骤：

　　把虚拟内存地址，切分成页号和偏移量的组合；

　　从页表里面，查询出虚拟页号，对应的物理页号；

　　直接拿物理页号，加上前面的偏移量，就得到了物理内存地址。

　　多级页表：

　　解决单页表占用内存空间大的问题。在一个实际的程序进程里面，虚拟内存占用的地址空间，通常是两段连续的空间。而不是完全散落的随机的内存地址。而多级页表，就特别适合这样的内存地址分布。