设计一个 CPU 的存储管理部件

设计一个 CPU 的存储管理部件，这个题留给大家思考。

CPU 里有存储管理部件，据说以前是在北桥芯片里。

存储管理部件的功能是地址映射（页映射），判断对内存的访问是否越界。

对内存的访问越界就是一个进程的代码访问了另一个进程的内存，这是不允许的。

但有些时候，操作系统允许多个进程之间共享一块内存，比如管道，或者共享内存。这通常用于进程间通信或传输数据。

共享内存允许共享这块内存的多个进程访问，存储管理部件应该也要支持这个功能。

实际上，一级 Cache 有自己的存储管理部件，二级 Cache 有自己的存储管理部件，三级 Cache 有自己的存储管理部件，虚拟内存有自己的存储管理部件。

这里的一级 Cache 二级 Cache 三级 Cache 是 CPU 的一级 Cache 二级 Cache 三级 Cache 。虚拟内存是操作系统的虚拟内存。

具体的，

一级 Cache 的存储管理部件的功能是一级 Cache 和虚拟内存之间的地址映射（页映射），以及防止内存的越界访问。

二级 Cache 的存储管理部件的功能是二级 Cache 和虚拟内存之间的地址映射（页映射），以及防止内存的越界访问。

三级 Cache 的存储管理部件的功能是三级 Cache 和虚拟内存之间的地址映射（页映射），以及防止内存的越界访问。

虚拟内存的存储管理部件的功能是内存和虚拟内存之间的地址映射（页映射），以及防止内存的越界访问。

每个存储管理部件都维护一份页表。

硬件上，一级 Cache 的存储管理部件应该在一级 Cache 的附近，访问一级 Cache 的存储管理部件和访问一级 Cache 一样快。

其实还有一个页表，维护页在页文件里的位置。这个页表称为页文件页表。

虚拟内存将常用的数据保存在内存里，不常用的数据保存在硬盘的一个文件里，这个文件就是页文件。

要加载一个页到内存时，需要知道页在页文件里的位置。页可能创建、销毁，为了避免页文件无限扩大，会 “重复利用” 页文件的空间来保存页，所以，页文件页表会经常添加删除插入页表项，而查找页文件页表的工作可以用软件的方式来做。可以用红黑树二分法来做。

但按理，页文件页表也可以用硬件的存储管理部件来实现，再增加一个存储管理部件就可以。但问题是，在 64 位架构下， 64 位地址有 4G * 4G = 16 EB 的地址空间， 16 EB 除以页的大小就是可能的页的数量，这个数量是很大的，虽然实际中并不会用到那么大，但在 64 位架构下，单个进程的虚拟内存确实可以申请超过 4G ，比如几十 G ，甚至上百 G 应该也可能。

总的来说，页的数量很多，如果要用硬件的存储管理部件来保存页表的话，需要很大的存储空间，这个可能不现实。

但反过来再想一下，如果有 1M 个页，也就是 100 万个页，够用了吧？假设一个页的大小是 4 KB， 1M 个页的空间是 1M * 4 KB = 4 GB ，

如果 10 M 个页，空间是 40 GB， 100 M 个页，空间是 400 GB，如果把页弄大一点，比如 16 KB，那么 100 M 个页的空间是 1.6 TB 。

把 100 M 个存储单元做到硬件里，按现在的技术来说，好像很平常。当然这里的存储单元比一个 Byte 大，应该是一个页表项的大小，当然，每个页表项可能会有相应的一些逻辑电路用于查找页表项和判断内存访问是否越界。

但因为查找页表项和判断内存访问越界的逻辑电路可能是每个页表项都会有，一个页表项对应一个页，所以当页的数量很大时，电路体量可能很庞大。

我估计，传统上，到目前为止，页文件页表的管理可能是由软件的方式实现的，即由操作系统实现，而不是硬件的存储管理部件。

在内存划出一段空间，将页表项保存在这段内存里，保存不下的，存入页文件，要用的时候，再从页文件加载到内存，这样，只要页文件够大，页文件页表可以持续扩展。

而实际上，保存不下的页表项存入页文件，要用的时候，再从页文件加载到内存，这个和虚拟内存类似，可以同样用虚拟内存来管理，这是 “自己管理自己” 。

既然统一纳入虚拟内存管理，那么 “在内存划出一段空间，将页表项保存在这段内存里” ，保存页表项的这段内存空间也可以不是固定的，统一由虚拟内存管理就好。

总之，这是 “自己管理自己” 。这样的程序是可以设计出来的。

其实，这跟内存堆的管理类似，甚至一样。这个管理逻辑是很啰嗦很麻烦的。

刚才说远了。

把存储管理部件搞清楚了， CPU 架构也差不多清楚了。

把逻辑电路原理搞清楚了，复杂指令集（CISC）、微指令、“流水” 架构什么的，也都是浮云。

无非就是在一个时钟周期尽量执行多个逻辑运算，对于需要多个时钟周期才能完成的指令功能，协调安排好各个逻辑运算，使之尽量并行协作，在尽可能少的时钟周期里完成指令功能。

在一个时钟周期里尽量执行多个逻辑运算，这需要固化这些逻辑运算和调度这些逻辑运算的逻辑运算到电路里，电路会膨胀，但执行速度会变快。

所以，把这些搞清楚了，画出 CPU 的架构图和逻辑电路图也很简单。

但是，当电路的规模很大时，要计算出电路参数使得电路稳定运行，这并不简单，需要一些工夫。

当电路规模很大时，在硬件工艺上，要把电路集成到很小的一块硅片上，这也不简单，也需要工夫。

CPU 本身也是一个计算机系统，只不过集成电路和 “纳米工艺” 让它微观化了，而我们又习惯于用高级的抽象来使用计算机，高级的抽象比如操作系统、编程语言、软件，所以， CPU 也变得复杂神秘深奥起来了。

其实本文说的这些，大部分都是我猜的，或者说推测的。

但不管怎么说，把存储管理部件搞清楚了， CPU 架构也差不多清楚了。

所以呢，设计一个 CPU 的存储管理部件，这个题留给大家思考吧，哈哈。

设计 一个 CPU 的 存储管理部件

设计一个 CPU 的存储管理部件