操作系统学习笔记：虚拟内存

一、绪论

操作系统的各种内存管理策略都出于同一个目的：同时将多个进程存放在内存中，以便允许多道程序设计。不过，这些策略都需要在进程执行之前将整个进程放在内存中。动态载入虽然能减轻这个限制，但需要程序员小心应用，并且花费额外的工作。

而虚拟内存则允许执行进程部分在内存中，一个显著的优点是程序可以比物理内存大。而且虚拟内存将内存抽象成一个巨大的数组，将用户视界的逻辑内存与物理内存分离，使得程序员不受内存存储的限制。简而言之，虚拟内存展现在程序员面前的是一个比物理内存要大得多的、地址连续的内存空间，而事实上是映射到支离破碎的物理内存，乃至磁盘上。

然而，虚拟内存的实现并不容易，使用不当反而可能大大地降低性能。

二、按需调页

1、基本概念

页需要用到的时候才调入内存。

这种方案需要硬件支持区分哪些页在内存，哪些在磁盘。采用有效/无效位来表示。当页表中，一个条目的该位为有效时，表示该页合法且在内存中；反之，可能非法，也可能合法但不在内存中。

当进程试图访问这些尚未调入内存的页时，会引起页错误陷阱（page-fault trap）。按以下步骤进行处理：

1）检查进程内部页表，通常与PCB一起保存。以确定该引用的合法性

2）如果非法，进程终止；否则进行调入：

3）找到一个空闲帧

4）调度一个磁盘操作，将所需页调入刚分配的帧

5）磁盘读操作完成后，修改内部表和页表（有效无效位？），表示该页已在内存中

6）重新开始因陷阱而中断的指令。

2、按需调页的性能

对于按需调页，降低页错误率至关重要。

另外是对交换空间的处理的使用。磁盘IO到交换空间通常比到文件系统要快，因为交换空间是按大块进行分配，并不使用文件查找和间接分配方法。因此，在进程开始时将整个文件镜像复制到交换空间，并从空间交换执行按页调度，那么有可能获得更好的性能。

另一种选择是开始时从文件系统进行按需调页，但置换出来的页写入交换空间，而后的调页则从交换空间中读取。这种方法确保只有需要的页才从文件系统中调入，又可以保证一定的性能。

三、写时复制

有些进程，比如fork()出来的子进程，并不需要按需调页，而是一开始与父进程共享页面，当子进程需要修改页的时候，才对该页复制一个副本，在副本上进行修改。是为写时复制。

当一个页需要写时复制的时候，从哪里分配空闲页很重要。许多操作系统为此提供空闲缓冲池。

四、页面置换

内存有时会过度分配，进程需要使用的页大于可分配内存；加上内存并不仅用于进程的页，IO缓存也需要使用大量的内存，会出现内存相对需求僧多粥少的局面，这时进程发生页错误的时候，操作系统准备好了要调入的所需页，却发现没有空闲帧可供分配。正所谓房子看好了，车也看好了，一切都看双色球了。

1、页置换

遇到这种情况，操作系统可以选择终止该嗷嗷待哺的进程，也可以交换出一个倒霉的进程。更多的时候，会采用页置换的方式：

如果没有空闲帧，就查找当前没有使用的帧，将其释放，空出来保存进程出错的页（也就是需要换入的页）。

如果换出的页有修改的话，还必须将页写回磁盘。可以通过设置修改位或脏位来提高性能。

页置换算法：

2、FIFO页置换

最简单的页置换算法。选择最旧的页进行置换。具体为创建一个FIFO队列来管理内存中的所有页，队列中的首页被置换，而新调入的页则加到队列的尾部。

FIFO算法容易理解和实现，但性能不总是很好。所替代的页可能仍在使用，换出去以后马上报页错误，要求换回来。

3、最优置换

置换最长时间不使用的页（不是久未使用，而是预测其未来经过最长时间才被使用？）。这种算法页错误率最低。

这种算法问题在于难以实现。

4、LRU页置换

最优置换的近似。最优置换与FIFO的关键区别在于，FIFO使用的是页调入时间，而最优置换看重的是页将来使用的时间。如果使用离过去最近作为不远将来的近似，那么可置换最长时间没有使用的页。根据过去来猜测未来。这种方法称为最近最少使用算法。

实现LRU算法，可用计数器，也可用栈：凡用过的页，就放到顶部，不用的就沉到栈底。

5、近似LRU页置换

很少有计算机系统能提供足够的硬件来支持真正的LRU页置换。然而，许多系统通过引用位方式来进行近似置换：

页表内的每个条目都关联一个引用位，每当引用一个页时，相应的引用位就被硬件置位；

刚开始时，所有引用位都清零，后来许多被置为1。通过检查引用位，可以知道哪些页使用过而哪些没有。这个信息是近似LRU置换算法的基础。

近似LRU置位算法有几种：

1）附加引用位算法

每页有一个8位的字节做引用位，定期刷新引用位。有引用的时候该字节最高位置1，其他位右移，挤掉原来的最低位。那么，引用位为最小值的页就可以被置换。

2）二次机会算法

当一个倒霉的页被选中时，检查其引用位，如果为0，直接置换掉；如果引用位为1，就给它一次机会，放过它，继续找下一张倒霉页。那张获得重生机会的页，其引用位清零，重置时间。在所有页都被寻找过一遍之前，它起码不会被替换掉。

3）增强型二次机会算法

通过将引用位和修改位作为一有序对来考虑：

（0,0）最近无使用也无修改：换吧，别犹豫了

（0,1）最近无使用但有修改：置换前要写回磁盘，请三思！

（1,0）最近有使用但无修改：可能很快又要使用

（1,1）最近有使用且有修改：可能很快又要使用，且置换前要写回磁盘，请三思！

6、基于计数的页置换

为每个页设置一个计数器，形成两种方案

1）最不经常使用页置换算法（LFU)

置换计数最小页。理由是活动页应该有更大的引用次数。但可能有如下问题：一个页可能开始时使用很多，但以后就不再使用。解决方法是定期将次数寄存器右移一位，以形成指数衰减的平均使用次数。

2）最常使用页置换算法（MFU)

置换计数最大页。理由：最小次数页可能刚刚调进来，且还没使用。

7、页缓冲算法

保留一个空闲帧缓冲池。

1）维护一个已修改页的列表。每当调页设备空闲时，就选择一个修改页写到磁盘上，并重置其修改位。这种方案增加了干净页，降低了置换时写出的概率。

2）保留一个空闲帧池，记住页与帧的对应关系。当帧需要重用时，就先从池中取，没有磁盘IO。

8、应用程序与页置换

有时，应用程序通过操作系统使用虚拟内存结果会更坏。数据库就是一个例子。因为数据库可提供自己的内存管理和IO缓冲，因为它更能理解自己的内存使用和磁盘使用。基于此，操作系统允许特殊程序将磁盘当成逻辑块数组使用，而无需通过操作系统的文件系统。

五、帧分配

如何在各个进程之间分配一定的空闲内存？

简单办法是将帧挂在空闲帧链表上，当发生页错误之时即进行分配。进程终止时帧再次放回空闲帧链表。

帧分配策略受到多方面限制。例如，分配数不能超过可用帧数，也必须分配至少最少数量。保证最少量的原因之一是性能。页错误增加会减慢进程的执行。并且，在指令完成前出现页错误，该指令必须重新执行。所以有足够的帧至关重要。

每个进程帧的最少数量由体系结构决定，而最大数量是由可用物理内存数量决定。

1、帧分配算法有

1）平均分配，每个进程一样多

2）按进程大小使用比例分

3）按进程优先级分

4）大小和优先级组合分

2、全局分配和局部分配

全局置换允许进程从所有帧集合中选择一个进行置换，而不管该帧是否已分配给其他进程，即它可以从其他进程抢夺帧，比如高优先级抢夺低优先级的帧；局部分配则要求每个进程只能从自己的分配帧中分配。

全局置换通常有更好的吞吐量，且更为常用。

六、系统颠簸

进程如果没有它所需要的帧，那么很快产生页错误，这时必须置换某个页。然而所有页都在使用，置换一个，立刻又要换回来，页错误频繁在发生，称为颠簸。

颠簸导致严重的性能问题。操作系统时刻注视CPU的使用率，如果CPU使用率太低，系统会引入新进程。采用全局置换算法，可不管页属于哪个进程，抢到就换。假设一个进程需要更多帧，开始出现页错误，从其他进程抢到帧。被抢的进程从就绪队列移出，CPU使用率下降；CPU调度程序发现后，调入更多进程，企图让CPU嗨起来。新进来的进程嗷嗷待哺，帧被抢夺得更激烈，等待队列更长，CPU使用率进一步下降，CPU调度程序更努力地调入更多的进程。。。

最终，进程主要忙于调页，系统不能完成一件工作。

使用局部置换可以限制系统颠簸，但不能完全解决这个问题。

1、工作集合模型

为了防止颠簸，进程必须获得足够多的帧才可以启动。操作系统跟踪每个进程的工作集合，为其分配大于其工作集合的帧数。如果还有空闲，才有可能启动另一进程。如果某个进程所有工作集合之和超过了可用帧总数，那么会被暂停，其帧分配给其他进程。挂起的进程等待以后重启。此为工作集合模型。困难在于跟踪工作集合。

2、页错误频率策略

除了工作集合，另一种防止颠簸的方案是页错误频率策略。

如果一个进程，页错误频率太高，说明需要更多的帧，给它！如果页错误频率太低，说明帧有富余，分些给别人。为进程设置页错误率上下限，机动地分配帧。

与工作集合模型一样，如果需要帧却无帧可分配，那么进程应该暂停，释放给其他同样高页错误频率的进程。

七、内存映射文件

通常，文件每次访问都需要一个系统调用和磁盘访问，但还有另一种方法：使用虚拟内存技术将文件IO作为普通内存进行访问。意思就是说，访问文件就像访问内存一样。

1、基本机制

将磁盘块映射成内存页（一页或多页）。刚开始时，页面调度，会产生页错误，这样，文件内容陆续读入物理内存矣。文件的读写就像内存访问一样，通过内存操作文件而不是系统调用read()和write()，从而简化。

其中，对文件的写可能不会立即写到磁盘上，除非脏页置换或操作系统定期检查，或者文件关闭？

如果一个文件多个进程共用，那么将其映射到各自的虚拟内存中，以允许数据共享。任一进程修改虚拟内存中的数据，其他进程都可以见到。如果有修改，则是修改各自的副本，写时复制。可能还有互斥。

2、WIN32 API 的共享内存

将存在于磁盘的文件放进一个进程的虚拟地址空间，并在该进程的虚拟地址空间中产生一个区域用于“存放”该文件，这个空间就叫做File View（存放在进程的虚拟内存中），系统并同时产生一个File Mapping Object（存放于物理内存中）用于维持这种映射关系，这样当多个进程需要读写那个文件的数据时，它们的File View其实对应的都是同一个File Mapping Object，这样做可节省内存和保持数据的同步性，并达到数据共享的目的。

3、内存映射IO

将IO设备映射到内存，那么对该部分内存进行读写，就如同对IO设备进行读写，而不必直接操作IO设备。比如说，屏幕上每一个点都对应一个内存地址，程序控制内存，就能控制屏幕显示。

八、内核内存的分配

当用户态进程需要额外内存时，可以从内核所维护的空闲页帧链表中获取页。通常，页帧分散在物理内存中，但是内核内存通常从空闲内存池中获取，主要由两个原因：

1）内核需要为大小不同的数据结构分配内存，因此必须节省使用，并尽量减低碎片浪费。许多操作系统的内核代码与数据不受分页系统控制

2）有的硬件需要直接与物理内存打交道，而不经过虚拟内存接口，因此需要内存常驻在连续的物理页中

内核进程进行内存管理的两个方法：

1、Buddy系统

从物理上连续、大小固定的段上进行分配，按2的幂大小来进行分配，如4K、8K等。优点是可通过合并而快速形成更大的段，但容易产生碎片。

2、slab分配

按照内核对象的数据结构要求的大小，预先分配好若干内存块，等待召唤使用。

具体来说，内核对象对应有高速缓存，而高速缓存含有若干个slab（就是尺寸合适的内存块？）。slab可有三种状态：满的、空的、部分。当分配的时候，先从空闲状态部分分配，不够从空的部分分配；还不够就从物理连续页上分配新的。

优点：

1）尺寸因应内核对象要求可变，没有碎片

2）预先准备，可快速满足要求

九、其他考虑

1、预调页

纯按需调页的一个显著特性是当一个进程开始时会出现大量页错误。而预调页的策略是同时将所需的所有页调入内存。关键是成本是否小于相应页错误的成本。

2、页大小

该用大页还是小页，是个问题。

1）大页有利于减少页表

2）小页有利于减少碎片，可更好地利用内存

3）小页传输快，大页IO好，但又不一定，小页因为寻址、传输快，局部性得以改善，总的IO就会降低，那么，应该用小页？

4）然而，大页可以降低页错误数量

……

切克闹，现在你告诉我，该用大页还是小页？

3、TLB范围

TLB可提高内存访问速度，如果没有TLB，则每次取数据都需要两次访问内存，即查页表获得物理地址和取数据。

TLB只维护页表中的一小部分条目，逻辑地址转换物理地址过程中，先在TLB中查找，如果找到，那么物理地址唾手可得；如果TLB中没有，那么使用置换算法，将相关条目置换进TLB，然后再得到物理地址。

那么提高TLB命中率至关重要。

提高TLB命中率可增加TLB条数，但代价不小，因为用于构造TLB的相关内存既昂贵又费电。另一个方法是增加页的大小，或提供多种页大小。

4、反向页表

反向页表可以节省内存，不过，当进程所引用的页不在内存中时，仍然需要一个外部页表以获得物理帧保存哪个虚拟内存页面的信息。所幸这只是在页错误时才需要用到，外部页表本身可以换出换入，不苛求一定完备。

5、程序结构

我们平常写程序，对内存根本不用关心。但有时了解一点内存知识可改善系统性能：

比方说，有一个128*128的二维数组，数据按行存放，如何遍历性能高？

int i,j;
int[128][128] data;

假如我们外循环按列进行：

for(int j=0;j<128;j++)
     for(int i=0;i<128;i++)
           data[i][j] = 0;

如果页刚好大小为128字，那么上述写法就相当于每个内循环都要调一个页，且每调一次都只是为了修改一个数。如果分配给该进程的帧数小于128，那么一共会产生 128 * 128 = 16384 个页错误！

但假如这样写：

for(int i=0;i<128;i++)
     for(int j=0;j<128;j++)
           data[i][j] = 0;

每调一页，都将该页上的数修改完毕才调下一页，总共产生128个页错误。

6、I/O互锁

允许页在内存中被锁住。

在全局置换算法中，一个进程发出IO请求，被加入到IO设备等待队列，而CPU交给了其他进程。这些进程发生页错误，偏偏置换了等待进程用于IO的缓存页，这些页被换出。好了，请求IO的进程等待到了IO设备，针对指定地址进行IO，然而帧早被其他进程的不同页所使用。

对这个问题，通常有两种解决方法：

1）绝不对用户内存进行IO，如果要进行IO，将用户内存数据复制到系统内存。要复制一次，开销太高了。

2）物理帧有一个锁住位，允许页锁在内存中。如果锁住，则不能置换。当IO完成，页被解锁。

锁住位用处多多，比如操作系统内核页通常加锁；低优先级进程的页至少要运行一次才能解锁被置换。