内存及系列问题

一、内存

1、内存的基础知识

1.1、什么是内存？有何作用？

内存是用于存放数据的硬件。程序执行前需要先放到内存中才能被CPU处理。

思考：在多道程序环境下，系统中会有多个程序并发执行，也就是说会有多个程序的数据需要同时放到内存中。那么，如何区分各个程序的数据是放在什么地方呢？

方案：给内存的存储单元编地址

内存地址从0开始，每个地址对应一个存储单元

内存中也有一个一个的“小房间”，每个小房间就是一个“存储单元”

如果计算机“按字节编址”，则每个存储单元大小为1字节，即1B，即8个二进制位

如果字长为16位的计算机“按字编址”，则每个存储单元大小为1个字，每个字的大小为16个二进制

补充知识：

1.2、进程的运行原理——指令

可见，我们写的代码要翻译成CPU能识别的指令。这些指令会告诉CPU应该去内存的哪个地址存/取数据,这个数据应该做什么样的处理。在这个例子中，指令中直接给出了变量x的实际存放地址（物理地址）。但实际在生成机器指令的时候并不知道该进程的数据会被放到什么位置。所以编译生成的指令中一般早体用罗辑地址(相对地址）

1.3、逻辑地址VS物理地址

宿舍四个人一起出去旅行，四个人的学号尾号分别是0、1、2、3。

住酒店时酒店给你们安排了4个房号相连的房间。四个人按学号递增次序入住房间。比如0、1、2、3号同学分别入住了5、6、7、8号房间。

四个人的编号0、1、2、3其实是一个“相对位置”，而各自入住的房间号是一个“绝对位置”。只要知道0号同学住的是房号为N的房间，那么M号同学的房号一定是N+M。

也就是说，只要知道各个同学的“相对位置”和“起始房号”，就一定可以算出所有同学的“绝对位置"

指令中的地址也可以采用这种思想。编译时产生的指令只关心“相对地址”，实际放入内存中时再想办法根据起始位置得到“绝对地址”

Eg:编译时只需确定变量x存放的相对地址是100（也就是说相对于进程在内存中的起始地址而言的地址）。CPU想要找到x在内存中的实际存放位置，只需要用进程的起始地址+100即可。

相对地址又称逻辑地址,绝对地址又称物理地址。

1.4、从写程序到程序运行

编译:由编译程序将用户源代码编译成若干个目标模块(编译就是把高级语言翻译为机器语言)

链接:由链接程序将编译后形成的一组目标模块，以及所需库函数链接在一起，形成一个完整的装入模块装入(装载）:由装入程序将装入模块装入内存运行

1.5、装入模块装入内存

装入模块中的指令地址指的是“相对地址”，即:相对于开始地址而言的地址。

装入的三种方式（用三种不用的方法完成逻辑地址到物理地址的转换）

绝对装入
静态重定位
动态重定位

1.5.1、装入的三种方式——绝对装入

绝对装入：在编译时，如果知道程序将放到内存中的哪个位置，编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址，将程序和数据装入内存。

Eg:如果知道装入模块要从地址为100的地方开始存放..

绝对装入只适用于单道程序环境

程序中使用的绝对地址，可在编译成汇编时给出，也可由程序员直接赋值。通常情况下都是编译或汇编时再转换为绝对地址。

1.5.2、装入的三种方式——静态重定位

静态重定位:又称可重定位装入。编译、链接后的装入模块的地址都是从o开始的，指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况，将装入模块装入到内存的适当位置。装入时对地址进行“重定位”，将逻辑地址变换为物理地址(地址变换是在装入时一次完成的）。

静态重定位的特点是在一个作业装入内存时，必须分配其要求的全部内存空间,如果没有足够的内存,就不能装入该作业。作业一旦进入内存后,在运行期间就不能再移动，也不能再申请内存空间。

1.5.3、装入的三种方式——动态重定位

动态重定位:又称动态运行时装入。编译、链接后的装入模块的地址都是从o开始的。装入程序把装入模块装入内存后，并不会立即把逻辑地址转换为物理地址，而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持。

Snipaste_2020-11-16_08-59-58

采用动态重定位时允许程序在内存中发生移动

并且可将程序分配到不连续的存储区中;在程序运行前只需装入它的部分代码即可投入运行，然后在程序运行期间，根据需要动态申请分配内存;便于程序段的共享，可以向用户提供一个比存储空间大得多的地址空间。

1.5.4、链接的三种方式

链接的三种方式:

静态链接：在程序运行之前，先将各目标模块及它们所需的库函数连接成一个完成的可执行文件（装入模块），之后不再拆开
装入时动态链接：将各目标模块装入内存时，边装入边链接的链接方式
运行时动态链接：在程序执行中需要该目标模块时，才对它进行链接。其优点是便于修改和更新，以便实现对目标模块的共享

Snipaste_2020-11-16_09-02-27

2、内存管理的概念

操作系统作为系统资源的管理者，当然也需要对内存进行管理，要管理些什么呢？

操作系统负责内存空间的分配与回收
操作系统需要提供某种技术从逻辑上对内存空间进行扩充
操作系统需要提供地址转换功能，负责程序的逻辑地址与物理地址的转换
操作系统需要提供内存保护功能。保证各进程各自存储空间运行，互不干扰

内存保护可采取俩种方法：

方法一：在CPU中设置一对上、下限寄存器，存放进程的上、下限地址。进程的指令要访问某个地址时，CPU检查是否越界

方法二：采用重定位寄存器（又称基址寄存器)和界地址寄存器（又称限长寄存器)进行越界检查。重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻地址。

Snipaste_2020-11-16_09-35-51

2.1、内存空间的扩容

2.1.1、覆盖与交换

2.1.1.1、覆盖技术

早期的计算机内存很小，比如IBM推出的第一台PC机最大只支持1MB大小的内存。因此经常会出现内存大小不够的情况。

后开人们引入了覆盖技术，用来解决“程序大小超过物理内存总和”的问题

覆盖技术的思想：将程序分为多个段（多个模块）。常用的段常驻内存，不常用的段在需要时调入内存。

内存中分为一个“固定区”和若干个“覆盖区”

需要常驻内存的段放在“固定区”中，调入后就不再调出（除非运行结束）。

不常用的段放在“覆盖区”，需要用到时调入内存，用不到时调出内存。

必须由程序员声明覆盖结构。操作系统完成自动覆盖。缺点：对用户不透明，增加了用户编程负担。

覆盖技术只用于早期的操作系统中，现在已成为历史

2.1.1.2、交换技术

交换（对换）技术的设计思想：内存空间紧张时，系统将内存中某些进程暂时换出内存，把外存中某些已具备运行条件的进程换入内存（进程在内存与磁盘间动态调度）

中级调度（内存调度），就是要决定将哪个处于挂起状态的进程重新调入内存。

交换（对换）技术的设计思想:内存空间紧张时，系统将内存中某些进程暂时换出外存，把外存中某些已具备运行条件的进程换入内存（进程在内存与磁盘间动态调度)

暂时换出外存等待的进程状态为挂起状态(挂起态，suspend)

挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态

1．具有对换功能的操作系统中，通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件，主要追求存储空间的利用率，因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分，被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度，因此对换区空间的管理主要追求换入换出速度，因此通常对换区采用连续分配方式（学过文件管理章节后即可理解）。总之，对换区的I/o速度比文件区的更快。
2．交换通常在许多进程运行且内存吃紧时进行，而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页，就说明内存紧张，此时可以换出一些进程;如果缺页率明显下降，就可以暂停换出。
3．可优先换出阻塞进程;可换出优先级低的进程;为了防止优先级低的进程在被调入内存后很快又被换出，有的系统还会考虑进程在内存的驻留时间...
(洼意:PCB会常驻内存，不会被换出外存)

Snipaste_2020-11-17_21-12-38

2.1.1.3、虚拟存储技术

一次性:作业必须一次性全部装入内存后才能开始运行。这会造成两个问题:①作业很大时，不能全部装入内存，导致大作业无法运行;②当大量作业要求运行时，由于内存无法容纳所有作业，因此只有少量作业能运行，导致多道程序并发度下降。

驻留性:一旦作业被装入内存，就会一直驻留在内存中，直至作业运行结束。事实上，在一个时间段内，只需要访问作业的一小部分数据即可正常运行，这就导致了内存中会驻留大量的、暂时用不到的数据，浪费了宝贵的内存资源。

局部性原理

时间局部性:如果执行了程序中的某条指令，那么不久后这条指令很有可能再次执行;如果某个数据被访问过，不久之后该数据很可能再次被访问。（因为程序中存在大量的循环)

空间局部性:一旦程序访问了某个存储单元，在不久之后，其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的，并且程序的指令也是顺序地在内存中存放的)

虚拟内存的定义和特征

虚拟内存有以下三个主要特征

多次性:无需在作业运行时一次性全部装入内存，而是允许被分成多次调入内存。

对换性:在作业运行时无需一直常驻内存，而是允许在作业运行过程中，将作业换入、换出。

虚拟性:从逻辑上扩充了内存的容量，使用户看到的内存容量，远大于实际的容量。

如何实现虚拟内存技术

虚拟内存技术，允许一个作业分多次调入内存。如果采用连续分配方式，会不方便实现。因此，虚拟内存的实现需要建立在离散分配的内存管理方式基础上。

Snipaste_2020-12-02_09-31-29

请求分页管理方式

请求分页存储管理与基本分页存储管理的主要区别：

在程序执行过程中，当所访问的信息不在内存时，由操作系统负责将所需信息从外存调入内存，然后继续执行程序。

若内存空间不够，由操作系统负责将内存中暂时用不到的信息换出外存。

操作系统要提供页面请求调页功能，将缺失页面从外存调入内存。

操作系统要提供页面置换的功能，将暂时用不到的页面换出外存。

页表机制

与基本分页管理相比，请求分页管理中，为了实现“请求调页”，操作系统需要知道每个页面是否已经调入内存:如果还没调入，那么也需要知道该页面在外存中存放的位置。

当内存空间不够时，要实现“页面置换”，操作系统需要通过某些指标来决定到底换出哪个页面:有的页面没有被修改过，就不用再浪费时间写回外存。有的页面修改过，就需要将外存中的旧数据覆盖，因此,操作系统也需要记录各个页面是否被修改的信息。

缺页中断机制

假设此时要访问逻辑地址=(页号，页内偏移量)= (0,1024)
在请求分页系统中，每当要访问的页面不在内存时，便产生一个缺页中断，然后由操作系统的缺页中断处理程序处理中断。
此时缺页的进程阻塞，放入阻塞队列，调页完成后再将其唤醒，放回就绪队列。
如果内存中有空闲块，则为进程分配一个空闲块，将所缺页面装入该块，并修改页表中相应的页表项。
如果内存中没有空闲块，则由页面置换算法选择一个页面淘汰，若该页面在内存期间被修改过，则要将其写回外存。未修改过的页面不用写回外存。

缺页中断机构

缺页中断是因为当前执行的指令想要访问的目标页面未调入内存而产生的，因此属于内中断

一条指令在执行期商，可能产生多次缺页中断。(如: copy A to B，即将逻辑地址A中的数据复制到逻辑地址B，而A、B属于不同的页面，则有可能产生两次中断)

地址变换机构

补充细节:
①只有“写指令”才需要修改“修改位”。并且，一般来说只需修改快表中的数据，只有要将快表项删除时才需要写回内存中的慢表。这样可以减少访存次数
②和普通的中断处理一样，缺页中断处理依然需要保留CPU现场。
③需要用某种“页面置换算法”来决定一个换出页面（下节内容④换入/换出页面都需要启动慢速的I/O操作，可见，如果换入/换出太频繁，会有很大的开销。
⑤页面调入内存后，需要修改慢表，同时也需要将表项复制到快表中。

页面置换算法

最佳置换算法（OPT）

最佳置换算法（OPT，Optimal）：每次选择淘汰的页面将是以后永不使用，或者在最长时间内不再被访问的页面，这样可以保证最低的缺页率。

例：假设系统为某进程分配了三个内存块，并考虑到有一个页面号引用串（会一次访问这些页面）：7,0,1,2,0,3,0,4,2,3,0,3,2,1,2,0,1,7,0,1

整个过程缺页中断发生了9次，页面置换发生了6次。

注意：缺页时未必发生页面置换。若还有可用的空闲时间块，就不用进行页面置换。

缺页率=9/20=45%

最佳置换算法可以保证最低的缺页率，但实际上，只有在进程执行的过程中才能知道接下来会访问到的是哪个页面。操作系统无法提前预判页面访问序列。因此，最佳置换算法是无法实现的。
先进先出置换算法（FIFO）

先进先出置换算法（FIFO):每次选择淘汰的页面是最早进入内存的页面
实现方法:把调入内存的页面根据调入的先后顺序排成一个队列，需要换出页面时选择队头页面即可。队列的最大长度取决于系统为进程分配了多少个内存块。
例:假设系统为某讲程分配了三个内存块，并考虑到有以下而而号引用串:

3,2,1,0,3,2,4,3,2,1,0,4
最近最久未使用置换算法（LRU）

该算法的实现需要专门的硬件支持，虽然算法性能好，但是实现困难，开销大
时钟置换算法（CLOCK）

最佳置换算法性能最好，但无法实现;先进先出置换算法实现简单，但算法性能差;最近最久未使用置换算法性能好，是最接近oPT算法性能的，但是实现起来需要专门的硬件支持，算法开销大。

时钟置换算法是一种性能和开销较均衡的算法，又称CLOCK算法，或最近未用算法（NRU，NotRecently Used)

简单的CLOCK算法实现方法:为每个页面设置一个访问位，再将内存中的页面都通过链接指针链接成一个循环队列。当某页被访问时，其访问位置为1。当需要淘汰一个页面时，只需检查页的访问位。如果是o，就选择该页换出;如果是1，则将它置为o，暂不换出，继续检查下一个页面，若第一轮扫描中所有页面都是1，则将这些页面的访问位依次置为0后，再进行第二轮扫描（第二轮扫描中一定会有访问位为o的页面，因此简单的CLOCK算法选择一个淘汰页面最多会经过两轮扫描)

改进型的时钟置换算法

第一优先级：最近没访问，且没修改的页面
第二优先级：最近没访问，但修改过的页面
第三优先级：最近访问过，但没修改的页面

第四优先级：最近访问过，且修改过的页面

	算法规则	优缺点
OPT	优先淘汰最长时间内不会被访问的页面	缺页率最小，性能最好；但无法实现
FIFO	优先淘汰最先进入内存的页面	实现简单；但性能很差，可能出现Belady异常
LRU	优先淘汰最近最久没被访问的页面	性能很好；但需要硬件支持，算法开销大
CLOCK（NRU）	循环扫描各页面第一轮淘汰访问位=0的，并将扫描过的页面访问位改为1.若第一轮没选中，则进行第二轮扫描	实现简单，算法开销小；但未考虑页面是否被修改过
改进型CLOCK（改进型NRU）	若用（访问位，修改位）的形式表述，则：第一轮：淘汰（0,0）第二轮：淘汰（0,1），并将扫描过的页面访问位都置为0 第三轮：淘汰（0,0）第四轮：淘汰（0,1）	算法开销较小，性能也不错

页面分配策略

页面分配、置换策略

驻留集:指请求分页存储管理中给进程分配的物理块的集合。
在采用了虚拟存储技术的系统中，驻留集大小一般小于进程的总大小。
若驻留集太小，会导致缺页频繁，系统要花大量的时间来处理缺页，实际用于进程推进的时间很少;驻留集太大，又会导致多道程序并发度下降，资源利用率降低。所以应该选择一个合适的驻留集大小。固定分配:操作系统为每个进程分配一组固定数目的物理块，在进程运行期间不再改变。即，驻留集大小不变
可变分配:先为每个进程分配一定数目的物理块，在进程运行期间，可根据情况做适当的增加或减少。即，驻留集大小可变
局部置换:发生缺页时只能选进程自己的物理块进行置换。
全局置换:可以将操作系统保留的空闲物理块分配给缺页进程，也可以将别的进程持有的物理块置换到外存，再分配给缺页进程。
何时调入页面
抖动（颠簸）现象
工作集

2.2、内存空间的分配与回收

连续分配：指为用户进程分配的必须是一个连续的内存空间。

2.2.1、连续分配管理方式

2.2.1.1、单一连续分配

在单一连续分配方式中，内存被分为系统区和用户区。系统区通常位于内存的低地址部分，用于存放操作系统相关数据;用户区用于存放用户进程相关数据。

内存中只能有一道用户程序，用户程序独占整个用户区空间。

优点:实现简单;无外部碎片;可以采用覆盖技术扩充内存;不一定需要采取内存保护（eg:早期的PC操作系统MS-DOS)。

缺点:只能用于单用户、单任务的操作系统中;有内部碎片;存储器利用率极低。

分配给某些进程的内存区域中，如果有些部分没有用上，就是“内部碎片”。

2.2.1.2、固定分区分配

20世纪60年代出现了支持多道程序的系统，为了能在内存中装入多道程序，且这些程序之间又不会相互干扰,于是将整个用户空间划分为若干个固定大小的分区,在每个分区中只装入一道作业，这样就形成了最早的、最简单的一种可运行多道程序的内存管理方式。

分区大小相等:缺乏灵活性，但是很适合用于用一台计算机控制多个相同对象的场合（比如:钢铁厂有n个相同的炼钢炉，就可把内存分为n个大小相等的区域存放n个炼钢炉控制程序)

分区大小不等:增加了灵活性，可以满足不同大小的进程需求。根据常在系统中运行的作业大小情况进行划分(比如:划分多个小分区、适量中等分区、少量大分区)

操作系统需要建立一个数据结构一一分区说明表，来实现各个分区的分配与回收。每个表项对应一个分区，通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态（是否已分配）。

当某用户程序要装入内存时，由操作系统内核程序根据用户程序大小检索该表从中找到一个能满足大小的、未分配的分区，将之分配给该程序，然后修改状态为“己分配”。

优点:实现简单，无外部碎片。

缺点:a.当用户程序太大时，可能所有的分区都不能满足需求，此时不得不采用覆盖技术来解决，但这又会降低性能; b.会产生内部碎片，内存利用率低。

2.2.1.3、动态分区分配

动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区，而是在进程装入内存时，根据进程的大小动态地建立分区，并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。(eg:假设某计算机内存大小为64MB，系统区8MB，用户区共56 MB.….)

问题：

系统要用什么样的数据结构记录内存的使用情况？

空闲分区表：每个空闲分区对应一个表项。表项中包含分区号、分区大小、分区起始地址等信息。

空闲分区链：每个分区的起始部分和末尾部分分别设置前向指针和后向指针。起始部分处还可记录分区大小等信息。
当很多个空闲分区都能满足需求时，应该选择哪个分区进行分配？

把一个新作业装入内存时，须按照一定的动态分区分配算法，从空闲分区表(或空闲分区链）中选出一个分区分配给该作业。由于分配算法算法对系统性能有很大的影响，因此人们对它进行了广泛的研究。
如何进行分区的分配与回收操作？

假设系统采用的数据结构是“空闲分区表”...如何分配？
- 情况一：回收区的后面有一个相邻的空闲分区
- 情况二：回收区的前面有一个相邻的空闲分区
  
  两个相邻的空闲分区合并为一个
- 情况三：回收区的前、后各有一个相邻的空闲分区
  
  三个相邻的空闲分区合并为一个
- 情况四：回收区的前、后都没有相邻的空闲分区

新增一个表项：

注：各表项的顺序不一定按照地址递增顺序排序，具体的排序方式需要依据动态分区分配算法来确定。

动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区，而是在进程装入内存时,根据进程的大小动态地建立分区，并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。

动态分区分配没有内部碎片，但是有外部碎片。

内部碎片,分配给某进程的内存区域中,如果有些部分没有用上。

外部碎片,是指内存中的某些空闲分区由于太小而难以利用。

如果内存中空闲空间的总和本来可以满足某进程的要求,但由于进程需要的是一整块连续的内存空间，因此这些“碎片”不能满足进程的需求。

可以通过紧凑（拼凑，Compaction)技术来解决外部碎片。

Snipaste_2020-11-20_20-09-37

动态分区分配算法：

首次适应算法

算法思想:每次都从低地址开始查找，找到第一个能满足大小的空闲分区。

如何实现:空闲分区以地址递增的次序排列。每次分配内存时顺序查找空闲分区链（或空闲分区表），找到大小能满足要求的第一个空闲分区。
最佳适应算法

算法思想:由于动态分区分配是一种连续分配方式，为各进程分配的空间必须是连续的一整片区域。因此为了保证当“大进程”到来时能有连续的大片空间，可以尽可能多地留下大片的空闲区，即，优先使用更小的空闲区。

如何实现:空闲分区按容量递增次序链接。每次分配内存时顺序查找空闲分区链（或空闲分区表），找到大小能满足要求的第一个空闲分区。

缺点：每次都选最小的分区进行分配，会留下越来越多的、很小的、难以利用的内存块。因此这种方法会产生很多的外部碎片。
最坏适应算法

又称最大适应算法（Largest Fit)

算法思想:为了解决最佳适应算法的问题――即留下太多难以利用的小碎片，可以在每次分配时优先使用最大的连续空闲区，这样分配后剩余的空闲区就不会太小，更方便使用。

如何实现:空闲分区按容量递减次序链接。每次分配内存时顺序查找空闲分区链（或空闲分区表)，找到大小能满足要求的第一个空闲分区。

缺点:每次都选最大的分区进行分配，虽然可以让分配后留下的空闲区更大，更可用，但是这种方式会导致较大的连续空闲区被迅速用完。如果之后有“大进程”到达，就没有内存分区可用了。
邻近适应算法

算法思想:首次适应算法每次都从链头开始查找的。这可能会导致低地址部分出现很多小的空闲分区，而每次分配查找时，都要经过这些分区，因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索，就能解决上述问题。

如何实现:空闲分区以地址递增的顺序排列（可排成一个循环链表）。每次分配内存时从上次查找结束的位置开始查找空闲分区链(或空闲分区表)，找到大小能满足要求的第一个空闲分区。

首次适应算法每次都要从头查找，每次都需要检索低地址的小分区。但是这种规则也决定了当低地址部分有更小的分区可以满足需求时，会更有可能用到低地址部分的小分区，也会更有可能把高地址部分的天分区保留下来(最佳适应算法的优点)

邻近适应算法的规则可能会导致无论低地址、高地址部分的空闲分区都有相同的概率被使用，也就导致了高地址部分的大分区更可能被使用，划分为小分区，最后导致无大分区可用（最大适应算法的缺点)综合来看，四种算法中，首次适应算法的效果反而更好

算法	算法思想	分区排列顺序	优点	缺点
首次适应	从头到尾找适合的分区	空闲分区以地址递增次序排列	综合看性能最好。算法开销小，回收分区后一般不需要对空闲分区队列重新排序
最佳适应	优先使用更小的分区，以保留更多大分区	空闲分区以容量递增次序排列	会有更多的大分区被保留下来，更能满足大进程需求	会产生很多太小的、难以利用的碎片；算法开销大，回收分区后可能需要对空闲分区队列重新排序
最坏适应	优先使用更大的分区，以防止产生太小的不可用的碎片	空闲分区以容量递增次序排列	可以减少难以利用的小碎片	大分区容易被用完，不利于大进程；算法开销大（原因同上）
邻近适应	由首次适应演变而来，每次从上次查找结束位置开始查找	空闲分区以地址递增次序排列（可排列成循环链表）	不用每次都从低地址的小分区开始检索。算法开销小（原因同首次适应算法）	会使高地址的大分区也被用完

2.2.2、非连续分配管理方式

2.2.2.1、基本分页存储管理的基本概念

如果允许将一个进程分散地装入到许多不相邻的分区中，便可充分地利用内存，而无需再进行“紧凑”

基于这一思想，产生了“非连续分配方式”，或者称为“离散分配方式”

连续分配：为用户进程分配的必须是一个连续的内存空间

非连续分配：为用户进程分配的可以是一些分散的内存空间

把“固定分区分配”改造为“非连续分配版本”

假设进程A大小为23MB，但是每个分区大小只有10MB，如果进程只能占用一个分区,那显然放不下。

解决思路:如果允许进程占用多个分区,那么可以把进程拆分成10MB+10MB+3MB三个部分，再把这三个部分分别放到三个分区中（这些分区不要求连续）...

进程A的最后一个部分是3MB，放入分区后会产生7MB的内部碎片。

如果每个分区大小为2MB，那么进程A可以拆分成11*2MB+1MB共12个部分，只有最后一部分1MB占不满分区,会产生1MB的内部碎片。

显然,如果把分区大小设置的更小一些,内部碎片会更小，内存利用率会更高。

基本分页存储管理的思想——把内存分为一个个相等的小分区，再按照分区大小把进程拆分成一个个小部分

分页存储管理的基本概念

将内存空间分为一个个大小相等的分区（比如:每个分区4KB），每个分区就是一个“页框”，或称“页帧”、“内存块”、“物理块”。每个页框有一个编号，即“页框号”(或者“内存块号”、“页帧号”、“物理块号”)页框号从o开始。
将用户进程的地址空间也分为与页框大小相等的一个个区域,称为“页”或“页面”。每个页面也有一个编号，即“页号”，页号也是从0开始。
（注:进程的最后一个页面可能没有一个页框那么大。因此，页框不能太大，否则可能产生过大的内部碎片)
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说，进程的页面与内存的页框有一一对应的关系。
各个页面不必连续存放，也不必按先后顺序来，可以放到不相邻的各个页框中。

如何实现地址的转换

进程在内存中连续存放时，操作系统是如何实现逻辑地址到物理地址的转换的？

CPU执行指令1，需要访问逻辑地址为80的内存单元，如何转换为物理地址？

逻辑地址为80的内存单元：

应该在1号页，该页在内存中的其实位置为450，逻辑地址为80的内存单元相对于该页的起始地址而言，“偏移量”应该是30.

实际的物理地址=450+30=480

要算出逻辑地址对应的页号
要知道该页号对应页面在内存中的起始地址
要算出逻辑地址在页面内的“偏移量”
物理地址=页面地址+页内偏移量

如何计算：

页号=逻辑地址/页面长度(取除法的整数部分)

页内偏移量=逻辑地址%页面长度（取除法的余数部分)页面在内存中的起始位置:操作系统需要用某种数据结构记录进程各个页面的起始位置。

页号=80/ 50= 1

页内偏移量= 80 % 50= 30

1号页在内存中存放的起始位置450

结论:如果每个页面大小为2*B，用二进制数表示逻辑地址，则末尾K位即为页内偏移量，其余部分就是页号
因此，如果让每个页面的大小为2的整数幂，计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量。

为了方便计算页号、页内偏移量，页面大小一般要为2的整数幂

逻辑地址结构

分页存储管理的逻辑地址结构如下所示：

地址结构包含两个部分:前一部分为页号，后一部分为页内偏移量w。在上图所示的例子中，地址长度为32位，其中0_{11位为“页内偏移量”，或称“页内地址”﹔12}31位为“页号”。

如果有K位表示“页内偏移量”，则说明该系统中一个页面的大小是2*个内存单元

如果有M位表示“页号”，则说明在该系统中，一个进程最多允许有2M个页面

页面存储管理中，如何实现地址转换？

要算出逻辑地址对应的页号
要知道该页号对应页面在内存中的起始地址
要算出逻辑地址在页面内的“偏移量”
物理地=页面地址+页内偏移量

注：如果题目中是用十进制数表示逻辑地址，则：

页号=逻辑地址/页面地址（取除法的整数部分）

页内偏移量=逻辑地址%页面长度（取除法的余数部分）

页表

为了能知道进程的每个页面在内存中存放的位置，操作系统要为每个进程建立一张页表

一个进程对应一张页表
进程的每一页对应一个页表项
页表记录进程页面和实际存放的内存块之间的对应关系
每个页表项的长度是相同的，页号是“隐含”的

为什么每个页表项的长度是相同的，页号是“隐含”的?

Eg:假设某系统物理内存大小为4GB，页面大小为4KB，则每个页表项至少应该为多少字节?4GB = 232B，4KB= 212B

因此4GB的内存总共会被分为232/ 212=220个内存块，因此内存块号的范围应该是О~220-1因此至少要20个二进制位才能表示这么多的内存块号，因此至少要3个字节才够

(每个字节8个二进制位，3个字节共24个二进制位)

各页表项会按顺序连续地存放在内存中
如果该页表在内存中存放的起始地址为x，则
M号页对应的页表项一定是存放在内存地址为×+3M因此，页表中的“页号”可以是“隐含”的。
只需要知道页表存放的起始地址和页表项长度，即可找到各个页号对应的页表项存放的位置
在本例中，一个页表项占3B，如果进程由n个页面，则该进程的页表总共会占3n个字节

基本地址变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。

通常会在系统中设置一个页表寄存器（PTR），存放页表在内存中的起始地址F和页表长度M。进程未执行时，页表的始址和页表长度放在进程控制块（PCB）中，当进程被调度时，操作系统内核会把它们放到页表寄存器中。

注意:页面大小是2的整数幂

设页面大小为L，逻辑地址A到物理地址E的变换过程如下:

①计算页号P和页内偏移量w（如果用十进制数手算，则P=A/L，W=A%L;但是在计算机实际运行时，逻辑地址结构是固定不变的，因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)

②比较页号P和页表长度M，若P>M，则产生越界中断，否则继续执行。（注意:页号是从O开始的,而页表长度至少是1，因此P=M时也会越界)

③页表中页号p对应的页表项地址=页表起始地址F+页号P*页表项长度，取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项，即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)

④计算E=b*L+w，用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)

例:若页面大小L为1K字节，页号2对应的内存块号b=8，将逻辑地址A=2500转换为物理地址E。等价描述:某系统按字节寻址，逻辑地址结构中，页内偏移量占10位，页号2对应的内存块号b=8，将逻辑地址A=2500 转换为物理地址E。

说明一个页面的大小为2^10B = 1KB

对表项大小的进一步探讨

每个页表项的长度是相同的，页号是“隐含”的

Eg:假设某系统物理内存大小为4GB，页面大小为4KB，的内存总共会被分为2^32/ 2^12= 2^{20个内存块，因此内存块号的范围应该是0~2}20-1

因此至少要20个二进制位才能表示这么多的内存块号，因此至少要3个字节才够（每个字节8个二进制位，3个字节共24个二进制位)

各页表项会按顺序连续地存放在内存中

如果该页表在内存中存放的起始地址为x，则M号页对应的页表项是存放在内存地址为×＋3*M

一个页面为4KB，则每个页框可以存放4096/3 = 1365个页表项，但是这个页框会剩余4096 % 3=1B页内碎片因此，1365号页表项存放的地址为×＋3*1365+1

如果每个页表项占4字节，则每个页框刚好可存放1024个页表项

1024号页表项虽然是存放在下一个页框中的，但是它的地址依然可以用X+4*1024得出

结论:理论上，页表项长度为3B即可表示内存块号的范围，但是，为了方便页表的查询,常常会让一个页表项占更多的字节，使得每个页面恰好可以装得下整数个页表项。

Snipaste_2020-11-21_15-06-44

2.2.2.2、具有快表的地址变换机构

局部性原理

时间局部性:如果执行了程序中的某条指令，那么不久后这条指令很有可能再次执行;如果某个数据被访问过，不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)

空间局部性:一旦程序访问了某个存储单元，在不久之后，其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)

什么是快表？

快表，又称联想寄存器（TLB），是一种访问速度比内存快很多的高速缓冲存储器，用来存放当前访问的若干页表项，以加速地址变换的过程。与此对应，内存中的页表常量称为慢表。

Snipaste_2020-11-21_15-28-01

引入快表后，地址的变换过程

①CPu给出逻辑地址，由某个硬件算得页号、页内偏移量，将页号与快表中的所有页号进行比较。

②如果找到匹配的页号，说明要访问的页表项在快表中有副本，则直接从中取出该页对应的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此，若快表命中，则访问某个逻辑地址仅需一次访存即可。

③如果没有找到匹配的页号，则需要访问内存中的页表，找到对应页表项，得到页面存放的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此，若快表未命中，则访问某个逻辑地址需要两次访存（注意:在找到页表项后，应同时将其存入快表，以便后面可能的再次访问。但若快表已满，则必须按照一定的算法对旧的页表项进行替换)

由于查询快表的速度比查询页表的速度快很多，因此只要快表命中，就可以节省很多时间。因为局部性原理，一般来说快表的命中率可以达到90%以上。

例:某系统使用基本分页存储管理，并采用了具有快表的地址变换机构。访问一次快表耗时1us，访问一次内存耗时100us。若快表的命中率为90%，那么访问一个逻辑地址的平均耗时是多少?

(1+100)* 0.9+(1+100+100)* 0.1=111ts

有的系统支持快表和慢表同时查找，如果是这样，平均耗时应该是(1+100)0.9+(100+100) 0.1=110.9 us

若未采用快表机制，则访问一个逻辑地址需要100+100= 200us显然，引入快表机制后，访问一个逻辑地址的速度快多了。

	地址变换过程	访问一个逻辑地址的访问次数
基本地址变换机构	①算页号、页内偏移量②检查页号合法性③查页表，找到页面存放的内存块号④根据内存块号与页内偏移量得到物理地址⑤访问目标内存单元	俩次访问
具有快表的地址变换机构	①算页号、页内偏移量②检查页号合法性③查快表。若命中，即可知道页面存放块号，可直接进行⑤；若未命中则进行④；④查页表，找到页面存放的内存块号，并且将页表项复制到快表中⑤根据内存块号与页内偏移量得到的物理地址⑥访问目标内存单元	快表命中，只需要一次访问；快表未命中，需要俩次访问

两级页表

如何实现地址变换

两级页表结构的逻辑地址结构
如何解决单级页表的问题？

问题一：页表必须连续存放，因此当页表很大时，需要占用很多个连续的页框

问题二：没有必要让整个页表常驻内存，因为进程在一段时间内可能只需要访问某几个特定的页面

可以在需要访问页面时才把页面调入内存（虚拟存储技术）。可以在页表项中增加一个标志位，用于表示该页面是否已经调入内存
需要注意的几个细节
1. 若采用多级页表机制，则各级页表的大小不能超过一个页面
例:某系统按字节编址，采用40位逻辑地址，页面大小为4KB，页表项大小为4B，假设采用纯页式存储，则要采用()级页表，页内偏移量为()）位?

页面大小=4KB =2^12B，按字节编址，因此页内偏移量为12位

页号=40 - 12= 28位

页面大小= 2^{12B，页表项大小=4B，则每个页面可存放2}12/4 =2^10个页表项

因此各级页表最多包含2^{10个页表项，需要10位二进制位才能映射到2}10个页表项，因此每一级的页表对应页号应为10位。总共28位的页号至少要分为三级

如果只分为两级页表，则一级页号占18位，也就是说页目录表中最多可能有2^18个页表项，显然，一个页面时放不下这么多页表项的。
1. 两级页表的访存次数分析（假设没有快表机构）
  - 第一次访存：访问内存中的页目录表
  - 第二次访存：访问内存中的二级页表
  - 第三次访存：访问目标内存单元

Snipaste_2020-11-21_17-37-37

2.2.2.3、基本分段存储管理方式

分段

进程的地址空间：按照程序自身的逻辑关系划分为若干个段，每个段都有一个段名（在低级语言中，程序员使用段名来编程），每段从0开始编制

内存分配规则：以段位单位进行分配，每个段在内存中占据连续空间，但各段之间不相邻。

编译程序会将段名转换为段号

分段系统的逻辑地址结构由段号（段名）和段内地址（段内偏移量）所组成。如：

段号的位数决定了每个进程最多可以分几个段

段内地址位数决定了每个段的最大长度是多少

段表

问题：程序分多个段，各段离散地装入内存，为了保证程序能正常运行，就必须能从物理内存中找到各个逻辑段的存放位置。因此，需为每个进程建立一张段映射表，简称“段表”

1.每个段对应一个段表项，其中记录了该段在内存中的起始位置（又称“基址”）和段的长度

2．各个段表项的长度是相同的。例如:某系统按字节寻址，采用分段存储管理,逻辑地址结构为（段号16位,段内地址16位)，因此用16位即可表示最大段长。物理内存大小为4GB（可用32位表示整个物理内存地址空间)。因此，可以让每个段表项占16+32=48位，即6B。由于段表项长度相同，因此段号可以是隐含的，不占存储空间。若段表存放的纪始地址为M.则K号郎对应的段表项存放的地址为M+K*6

地址变换

Snipaste_2020-12-02_08-30-43

分段、分页管理的对比

页是信息的物理单位。分页的主要目的是为了实现离散分配，提高内存利用率。分页仅仅是系统管理上的需要，完全是系统行为，对用户是不可见的。

段是信息的逻辑单位。分段的主要目的是更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的，用户编程时需要显式地给出段名。

页的大小固定且由系统决定。段的长度却不固定，决定于用户编写的程序。

分页的用户进程地址空间是一维的，程序员只需给出一个记忆符即可表示一个地址。

分段的用户进程地址空间是二维的，程序员在标识一个地址时，既要给出段名，也要给出段内地址。

分段比分页更容易实现信息的共享和保护

分段比分页更容易实现信息的共享和保护。不能被修改的代码称为纯代码或可重入代码〈不属于临界资源），这样的代码是可以共享的。可修改的代码是不能共享的

访问一个逻辑地址:需要几次访存?

分页(单级页表):第一次访存-—查内存中的页表，第二次访存--访问目标内存单元。总共两次访存

分段:第一次访存—一查内存中的段表，第二次访存――访问目标内存单元。总共两次访存

与分页系统类似，分段系统中也可以引入快表机构，将近期访问过的段表项放到快表中，这样可以少一次访问，加快地址变换速度。

Snipaste_2020-12-02_08-38-14

2.2.2.4、段页式管理方式

分页、分段的优缺点分析

	优点	缺点
分页管理	内存空间利用率高，不会产生外部碎片，只会有少量的页内碎片	不方便按照逻辑模块实现信息的共享和保护
分段管理	很方便按照逻辑模块实现信息的共享和保护	如果段长过大，为其分配很大的连续空间会很不方便。另外，段式管理会产生外部碎片