漫谈 C++ 的内存堆实现原理

如果我来设计 C++ 的内存堆，我会这样设计：

进程首先会跟操作系统要一块大内存区域，我称之为 Division ，简称 div 。

然后，将这块 div 作为堆，就可以开始从堆里分配内存了。

堆里未分配可使用的内存区域称之为 Free Space ，一开始的时候， div 里只有一个 Free Space ，就是整个 div 。

如果只分配不回收的话， div 里永远都只有一个 Free Space 。随着分配和回收， div 里会产生多个 Free Space 。

我们需要建立一张堆表来记录 Free Space ，这样才能知道每一次分配应该到哪个 Free Space 里分配。

堆表应该是一个链表，便于插入和删除表项。表项就是 Free Space ，或者说表项描述 Free Space 。所以表项会包含 2 个字段，一个是 Free Space 的起始地址，另一个是 Free Space 的结束地址。

同时还应该有一个指针，指向当前在用的表项，一次分配就是在当前表项指向的 Free Space 里分配，如果当前 Free Space 的大小不足以分配本次申请的内存块大小，则将指针指向当前 Free Space 的下一个 Free Space 。如果下一个 Free Space 的大小也不够，那么就继续指向下一个 Free Space 。如此循环。

那如果最后一个 Free Space 的大小也不够的话，就需要向操作系统要一个新的 div 。注意， Free Space 只能属于一个 div ，不能跨 div 。

如果堆里的 Free Space 比较多，那么如果 Free Space 大小不够，有可能会连续找多个 Free Space 才找到足够大小的 Free Space ，这里就产生了一个性能问题。

最坏的情况， “从头找到尾” ，到最后一个 Free Space 才足够大小。但，这还不是最坏的 ^^ ，如果最后一个 Free Space 的大小也不够的话，就要跟操作系统要一个新的 div ，这好像要 “更坏” 一点。 ^^

还有一个重要的问题需要考虑，就是如果跟操作系统要了 1 个以上的 div ，如果长期占用，这是一个不小的空间。那么，要怎样在 div 中的内存全部都已经回收（整个 div 是一个 Free Space）的时候，将 div 归还操作系统呢？

可以通过一个计数器。可以为每个 div 设置一个计数器，同时在堆表项里增加一个字段： Free Space 所在的 div 。

这样，每次分配的时候就在计数器里加 1 ，每次回收就让计数器减 1 ，如果减 1 以后计数器的值是 0 ，那么就说明 div 已经全部回收，可以将 div 归还操作系统。

最后，我很好奇， C++ 是怎么解决内存碎片的问题的。哈哈哈哈

突然发现堆的管理算法有点小复杂，如果堆表本身占用的内存空间是固定的，那么如果 Free Space 的数量超出了对表的空间所能存储的数量，这就有问题，如果舍弃一些比较小的 Free Space ，会造成内存泄露。

如果堆表的存储空间也是通过堆的方式来分配，那么，当应用程序申请了一块内存，此时产生了一个新的 Free Space ，为了记录这个 Free Space ，需要为描述这个 Free Space 的堆表项也申请一块内存，这样 Free Space 又会发生变化，可能产生 1 个新的 Free Space，或者要记录的这个 Free Space 发生变化，需要把这些情况也考虑进去。

还有一种情况是归还内存块的时候，这个内存块刚好在 2 个 Free Space 中间，那么归还这个内存块就不是简单的在堆表里添加一个堆表项，而是要和前后 2 个 FreeSpace “合并” 起来。这 3 个 Free Space 会合并成 1 个 Free Space ，在堆表里会删除原来的 2 个 Free Space 表项，同时在这 2 个表项的位置添加入合并后的新表项。

问题是，要怎么知道归还的内存块在某 2 个 Free Space 中间？好像只能遍历。但这意味着每次归还的时候都要遍历。

然后。

实际上，不仅仅内存块在 2 个 Free Space 之间会存在这个问题，只要归还的内存块的任一边（前或后）和 1 个 Free Space 相连，都需要 “合并” 。

如果要快速的找到和自己邻近的 Free Space ，可能需要建立索引。可以建立不止一个的索引。

比如可以按起始位置建立索引，同时还可以按 Free Space 的大小建立索引。前者可以快速的寻找和当前归还的内存块相邻的 Free Space 。后者可以快速的寻找接近指定大小的 Free Space ，这可以用在分配的时候，寻找接近申请内存块大小的 Free Space 进行分配有利于提高内存利用率，减少碎片。

索引也可以排序，如果要优先从小的 Free Space 或者大的 Free Space 来分配的话，索引的排序作用也可以派上用场。

关于索引，我在《我发起了一个 .Net 开源数据库项目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 中有一些论述。实际上，我正是考虑数据库中 Data Block 的 Free Space 如何管理，所以才继续思考内存堆的管理问题，然后就产生了上面的一些思考结果。

可以设想一下具体的做法：

如果不考虑堆的无限增长的话，设计起来并不太难：）所谓无限增长，主要是指堆表的无限增长。堆表为什么会无限增长呢？堆表是保存 Free Space 的，如果 Free Space 无限增长，那么堆表就会无限增长。 Free Space 的数量是不确定的，但理论上，似乎不能给出一个限制。如果我们给定堆表的长度是 1万，那么就只能记录 1万个 Free Space ，超出 1万个的 Free Space 会因为不能记录而处于 “遗弃” 的状态，既不能分配也不能回收。这就造成了内存泄漏。

如果在堆表达到上限的时候抛出异常 “堆表超出最大范围” ，就像 StackOverflow 或者 OutOfMemory ，但这可能会限制了应用程序的能力。

如果按照上文的说法，堆表的存储本身也完全通过堆分配进行，这样可以很灵活，看起来只要内存空间足够，那么，堆表可以无限增长。

但这种做法是 “自己描述自己” 的一个循环，会导致算法复杂，循环，或者无解。所以我们放弃了这种方式。

问题出在哪里呢？堆表项自身对于内存空间的占用不能计算到堆的分配里。堆表应该是单独占用一块空间，堆表项及索引项的添加删除在这个空间也会造成空闲空间（Free Space），但这些 Free Space 不能计算到堆里，而应该是独立于堆的存在。否则就会陷入上述的 “自己描述自己” 的循环。总之情况很复杂，可能无解。当然也许有解，但我不想继续思考下去了：）

所以，回到开始，如果不考虑堆的无限增长的话，就是说给定一个堆表的固定大小，我们这样来设计堆试试看。经过上面的论述，实际上，如果要设计无限增长的堆表，那么，在固定大小的堆表基础上，增加一点：当当前堆表空间不够时，再申请一块堆表空间用于继续存放堆表，这样堆表就能继续增长了。

我们提供一块连续的内存空间来存储堆表，这块内存空间我们称之为堆表空间。按照上面说的，我们先尝试实现一个固定大小的堆表空间的堆。

堆表的内容包括 Free Space 项和索引。索引由索引项组成，索引项最终会指向堆表项， Free Space 项之间通过链表的方式相连。 Free Space 项和索引项都存储在堆表空间里。

堆表还包括一个指针，指向堆表的最后一个元素的结束地址的下一个地址，我们将这个指针称为 “Append 指针” 。

所有新建的堆表项（Free Space 项和索引项）都添加至 Append 指针指示的地址，每添加完一个堆表项， Append 指针会指向这个堆表项的结束地址的下一个地址。当 Append 指针指向的地址到堆表的结束地址之间的空间不够存放新的堆表项时，会检查 “堆表空闲空间计数器” ， —— 等 —— 什么是 “堆表空闲空间计数器” ？在堆表的使用过程中，随着 Free Space 项和索引项的添加删除，当然也会出现 “空闲空间” ，我们会用一个整数变量，来记录空闲空间有多少（以 Byte 为单位），每次删除堆表项（Free Space 项和索引项）的时候，会将回收的空闲空间累计到这个整数变量里。这个变量就是 “堆表空闲空间计数器” 。注意， “堆表空闲空间计数器” 记录的是 Append 指针指向的地址之前 “已使用的空间” 中因堆表项的删除而 “空出来” 的空闲空间。这些空闲空间平时不会去动它，只有上面说的 “当 Append 指针指向的地址到堆表的结束地址之间的空间不够存放新的堆表项时” ，才会去关心它。怎么关心呢？这个时候，会做一次 “垃圾回收” ，就是把这些空闲空间后面的数据向前移动，填补这些空闲空间，就可以了。当然，会先检查 “堆表空闲空间计数器” ，如果计数器值为 0 ，表明没有空闲空间，不需要垃圾回收，大于 0 表示有空闲空间，需要垃圾回收。如果没有要回收的空闲空间，或者回收了空闲空间以后 Append 指针指向的地址到堆表的结束地址之间的空间仍然不够存放新的堆表项，怎么办呢？对于固定大小的堆表，则抛出异常 “堆表超出最大范围” ，就像 StackOverflow 或者 OutOfMemory 。对于可以无限增长的堆表，则新申请一块堆表空间，继续工作。新的堆表空间和原来的堆表空间之间通过链表的方式相连。

一个堆表空间包括 3 个部分组成：

1 一块连续的内存空间

2 Append 指针

3 堆表空闲空间计数器

要申请新的堆表空间，需要提前进行，不要等到空间不够用的时候再进行。这是因为新的堆表空间的申请同样也是通过堆的方式进行，同样需要在堆表里记录堆表项（Free Space 项和索引项）。当某一次申请或回收需要记录堆表项（Free Space 项和索引项）而空间不够时再去申请新的堆表空间，则本次应用程序的申请或者回收所产生的堆表项（Free Space 项和索引项）和申请新的堆表空间所产生的堆表项（Free Space 项和索引项）要放在一起计算和存储，这样情况很复杂。

所以，应用程序的申请和回收内存块，和申请新的堆表空间，应该是 2 次独立操作。所以需要提前进行 “未雨绸缪” 。提前到什么程度呢？在原来的堆表空间的剩余空间还足够存储一次申请内存块产生的可能的最大数量的堆表项（Free Space 项和索引项）的时候。

申请一次内存块可能产生多少堆表项（Free Space 项和索引项）？ Free Space 项容易理解，上文也分析过。那么会产生多少索引项？

上文中提到可以创建 2 个索引： 1 Free Space 起始地址作为检索条件的索引， 2 Free Space Size（空间大小）作为检索条件的索引。

索引 1 可以用做回收时查询和回收的内存块相邻的 Free Space ，如果 2 者是相接的，则会进行合并。

索引 2 可以用做分配时查找 Size（空间大小）最接近申请内存块大小的 Free Space 。

但实际上，索引的创建也是比较消耗时间的，分配可以采用前文最早提出的先在当前 Free Space 中分配，若当前 Free Space 的空间大小不足以分配，则查找下一个 Free Space 分配，以此递推。在内存空间充裕的条件下，这种方式比查找索引快，同时避免了创建索引消耗的时间。

我们接下来就来分析索引的创建和查询：

根据上述，我们只会建立和使用索引 1 ，用于回收时合并相接的 Free Space 。

索引 1 在分配时创建（更新），在回收时查询并更新。

索引 1 的索引项是这样：最高位字节用来保存索引项的值，只会用到低位的 2 位，表示 4 种情况： 00 , 01 , 10 , 11 。后面再跟 4 个字节或 8 个字节表示指向的子索引项或者 Free Space 项的地址。如果是 32 位或 “Any CPU” 应用程序，则是 4 个字节，如果是 64 位应用程序，则是 8 个字节。

在分配时，用于分配的 Free Space 的大小（Size）和起始地址会发生变化。对于索引 1 ，只需根据起始地址来更新索引即可。

Free Space 的起始地址字段表示空闲空间的起始地址。同上，如果是 32 位或 “Any CPU” 应用程序，则是 4 个字节，如果是 64 位应用程序，则是 8 个字节。根据《我发起了一个 .Net 开源数据库项目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 文中对于索引的论述，对于 32 位的数据，会建立 32 / 2 = 16 个索引项 -_- ，对于 64 位的数据，会建立 64 / 2 = 32 个索引项 -_- 。

所以，对于 32 位或 “Any CPU” 应用程序，分配时 Free Space 起始地址发生变化需要修改索引最多需要约 16 个索引项，或者说时间花费是 O(16) 。因为检索 1 个索引项需要判断 4 种情况： 00 , 01 , 10 , 11 。所以我们可以假设 1 次操作的时间是 4ns （4 纳秒），那么 O(16) 的时间就是 16 * 4 = 64 ns （64 纳秒）。而回收需要查找索引找到和回收的内存块相邻的 Free Space ，同时回收后可能更新相邻 Free Space 的起始地址（合并），或者产生一个新的 Free Space ，对于前者，需要修改索引，对于后者，需要创建索引，但不管是哪种，最多需要检索（修改）的索引项约 16 个，可以认为时间花费是 O(16) ，而回收时查找索引寻找相邻 Free Space 的时间花费也可以认为是 O(16) ，所以加起来就是回收的时间花费是 O(16) + O(16) = O(32) ，同上，假设 1 次操纵的时间是 4ns ，则回收的时间花费是 32 * 4 = 128 ns （128 纳秒）。当然分配和回收具体花费的时间还会包括修改 Free Space 起始地址， Next 指针，合并时删除多余的 Free Space 项等，这些先忽略不计，在下面估算的时候会酌情估算进去。

一次分配的时间是 64ns ，再加上分配时可能发生的一些遍历（在当前 Free Space 的大小不够时，访问下一个 Free Space 尝试分配，以此递推），就按 80ns 算， 1 秒钟大概可以进行 1200万次分配。如何？还行吧，呵呵。不过比起我想象中的 new ，还是慢了一点，我想象中的 new 应该是 1ns new 一个嘛！ P： new 就是分配。

一次回收的时间是 128ns ，就按 150ns 算， 1 秒钟大概可以进行 600万次回收。能不能再快一点？ ^^

对于 64 位应用程序，时间花费是 32 位的 2 倍，所以 1 秒钟可以分配 600万次，回收 300万次。如何？哎？为什么 64 位反而慢了？

上面的分配和回收的执行速度是针对 1 个 CPU 核分析的，但对于多核，分配和回收的执行速度也是如此。因为堆是进程内所有线程共享的，堆表也是共享的，在进行分配和回收时要修改堆表，此时需要对堆表进行同步/互斥（Lock），所以，对于多核，分配和回收的执行速度也是如此。

从这里可以看出，堆的这一特性会成为瓶颈。在高频高密度计算的场合。比如高并发实时响应式系统。说的直接一点，就是跟现在的互联网大规模计算有关。

这一类型的瓶颈也表现在其它方面。比如套接字（Socket）， Socket 对于每个网卡只会有一个线程负责从网卡读写数据。这是我的推测。一个端口（Port）的 Socket 由一组线程组成： 1 负责从网卡读写数据的线程（1 个网卡对应 1 个线程）， 2 处理和分发数据给应用程序的线程们（有若干个线程，线程数和 CPU 的核数对应，可以包括虚拟线程(超线程) 数）。在线程 1 和线程 2 们协作的时候，会有一个共享数据区，线程 1 会把从网卡读取到的数据放到共享数据区，线程 2 们会从共享数据区取出数据处理分发。显然，线程 1 和线程 2 们的协作需要同步/互斥（Lock），

我们可以看一下这篇文章《面向对象编程的弊端是什么？》 https://www.zhihu.com/question/20275578/answer/136886316?utm_source=com.tencent.tim&utm_medium=social&utm_oi=697587017629851648

文中有一幅图：

如图红线所示， Mutex（同步 / 互斥 Lock）的时间是 17ns （17 纳秒）。这个时间是一个不太能忽视的时间。

所以，这会成为利用并行计算大幅提升计算能力的瓶颈。而利用并行计算大幅提升计算能力正是当下和未来的主题。

另外就是，一个网卡只有一个 IO 线程，这也可能成为瓶颈。当网络技术发展到 5G 或 6G 的时候，会不会有 NPU（Net Process Unit）出现？就像 GPU 一样。 ^^

实际上，对于堆表的无限增长，有一个 “终极” 的解决办法，或者说更好的办法。就是 GC （垃圾回收器）。

在现代，或者说 “当代” 的语言，如 C# , Java 里都有 GC 。 GC 可以将 Free Space 的数量控制在有限和很少的范围。这样就不存在堆表的无限增长了。

然后。

当然， GC 要登记所有变量，并定期遍历，移动数据，这些也要花费时间的。

堆表的无限增长，这是一个问题。堆表增长，表示 Free Space 增多，碎片也增多，这样在分配时可能会遍历比较多的 Free Space 。

对于 64 位应用程序， 64 位理论上的寻址空间可以达到 16eb ，如果应用程序对于存储空间的使用是没有限制的，那么，一段时间之后，堆表，或者说 Free Space （包括碎片）的数量可能会达到很大的数量。

假想一下，如果 Free Space 很多，碎片也很多，那么可能要遍历很多次才能找到大小足够的 Free Space 进行分配。这个时候，我们可以考虑加入这样的算法，最多遍历 10 个 Free Space ，遍历了 10 个 Free Space 还找不到大小足够的 Free Space ，则向操作系统申请 1 个新的 div ，并将 div 作为新的 Free Space 插入到当前位置，并从这个 div（新的 Free Space）中分配。分配以后，下一次分配当然也会从这个 div 开始，如果这个 div 的剩余空间不够，则访问下一个 Free Space 。如果访问了 10 个 Free Space 也找不到足够大小的 Free Space ，则重复上述流程，向操作系统申请 1 个新的 div ，并将 div 作为新的 Free Space 插入到当前位置，并从这个 div（新的 Free Space）中分配。以此递推。

这种方式，可能会浪费一些空间，或者说，会向操作系统申请多一些的空间（div），但是在时间上提高了效率。这也算是 “空间换时间” 吧。在现在来讲，硬件容易扩充，提升计算速度是一个主要目标。

根据以上，我们再来整理一下具体的做法。

我们以 64位应用程序的标准来实现：

当进程启动时，会分配一块固定大小的连续空间，作为堆的基础元数据区，基础元数据区包括 5 部分：

1 Append 指针，指向堆表可插入堆表项的地址（当前最后一个堆表项之后），插入堆表项后， Append 指针会指向堆表项结束地址的下一个地址。 Append 指针的初始值应指向第 5 个堆表项的起始位置。因为会在堆表中预先建立 4 个 1 级索引项，见下面第 4 部分。

2 堆表的 Free Space 项链表头指针，指向 Free Space 项链表的头。（Free Space 项之间通过链表的方式连接起来）

3 当前 Free Space 项指针，指向上一次用于分配的 Free Space 项。下一次分配会先尝试在上一次分配的 Free Space 中进行，若 Free Space 的大小不够，会访问下一个 Free Space 尝试分配。分配成功后，当前 Free Space 项指针会指向分配成功的 Free Space 项。当然这里面还有些具体的逻辑，比如访问超过 10 个 Free Space 项仍然找不到大小足够的 Free Space ，则会向操作系统申请新的 div ，作为 Free Space 加入进来，然后在这个新的 div 中分配。

4 堆表的初始空间。堆表的初始空间可以是 1 MB 。进程启动时，会初始化基础元数据区，此时应在堆表的第 1 ~ 4 个堆表项位置预先建立 1 级索引项（00 , 01 , 01 , 11）。所谓初始空间是指这部分是固定不变的，之后堆表空间不够用时，会在堆中申请新的堆表空间。这些新申请的堆表空间空出来的时候会归还堆，但初始空间是不变的，不变是指一直存在，大小不变。且初始空间不属于堆。

5 Next 指针，指向下一个堆表空间。随着堆的规模的增长，堆表大小不够时，会从堆里申请新的堆表空间，新的堆表空间会和初始空间用链表的方式连接起来，可以申请多个堆表空间，如：初始空间 -> 第 1 个新申请空间 -> 第 2 个新申请空间 -> 第 3 个新申请空间 -> …… 第 n 个新申请空间 -> ……

当堆的规模缩小时，会释放空闲的堆表空间（归还堆）。

初始空间不属于堆，当然永远不会释放。

接下来，我们这样来定义堆表项：

堆表项分为 2 种：

1 索引项

2 Free Space 项

具体规则是：

1) 索引项和 Free Space 项都占用 34 个字节。第 1 个字节是标识字节，为 1 表示索引项，为 2 表示 Free Space 项，为 0 表示已删除。

2) 对于索引项，第 2 个字节表示索引值，就是 00 , 01 , 10 , 11 这 4 种值中的一种，实际上这 4 种值只用到了 2 位，不过我们还是用一个字节来存储。如果是十进制表示这 4 个值，就是 0 , 1 , 2 , 3 。我们设计的是 4 阶索引，第 3 ~ 10 个字节存储第 1 个子索引项或 Free Space 项的地址（64 位地址用 8 个字节存储），第 11 ~ 18 个字节存储第 2 个子索引项的地址，第 19 ~ 26 个字节存储第 3 个子索引项的地址，第 27 ~ 34 个字节存储第 4 个子索引项的地址。若 8 个字节表示的 64 位地址（ulong 无符号长整型 uInt64）为 0 ，表示子项不存在。有关索引和 4 阶索引，我在《我发起了一个 .Net 开源数据库项目 SqlNet》 https://www.cnblogs.com/KSongKing/p/9501739.html 一文中有论述。

所以，可以看出，索引项长度是 1 + 1 + 8 + 8 + 8 + 8 = 34 个字节。

3) 对于 Free Space 项，第 2 ~ 9 个字节表示起始地址，第 10 ~ 17 个字节表示结束地址。第 18 ~ 25 个字节表示所在的 div 的起始地址。第 26 ~ 33 个字节表示 Next 指针指向下一项 Free Space 项（Free Space 项之间会通过 Next 指针来用链表的方式连接起来）。 Free Space 项的长度是 1 + 8 + 8 + 8 + 8 = 33 个字节。

为了便于管理， Free Space 项的长度也定义为 34 个字节，和索引项一样。多出来的 1 个字节不会用到。

将索引项和 Free Space 项都定义为 34 位是便于管理，或者说便于算法处理。堆表进行垃圾回收的时候，只需要每隔 34 个字节检查一次标识字节，就可以知道堆表项是否已删除，若已删除则将后面的堆表项移动上来，填补已删除的空闲空间。这就是堆表的垃圾回收。

div ，接下来说明 div 的定义规则。 div 是进程向操作系统申请的一块大的内存区域，用于作为堆空间。

第 1 次分配内存块时会申请第 1 块 div 。如果从来没有申请过内存块，则不会申请 div 。

div 分为 3 个部分：

1 结束地址， div 的结束地址，用 8 个字节表示（ulong 无符号长整型 uInt64）

2 分配计数器 useCount ，用于记录分配的内存块数量，若计数器的值为 0 ，表示 div 完全空闲，即没有分配任何空间，可以归还操作系统。当然刚申请到 div 的时候，计数器的值也是 0 ，不过那时会接着用于分配。计数器也用 8 个字节表示（ulong 无符号长整型 uInt64）

3 剩余的空间用于分配。

接下来说明运行逻辑：

我们先估算一下， 1 MB 的堆表空间够存放多少个 Free Space 项（包含索引项）？

Free Space 项的地址是 64 位地址，要为 64 位地址建立索引，需要 64 / 2 = 32 个索引项。每个索引项占据的空间是 34 个字节，再加上 Free Space 项占据的 34 个字节， 1 个 Free Space 需要的存储空间是 (32 + 1) * 34 = 1122 个字节。实际中会比 1122 小，因为索引的父节点存在共用的现象。我们可以按 1024 来算，存储一个 Free Space 需要 1024 个字节（包含索引项），那么 1 MB 可以存储 1024 个 Free Space（包含索引项）。

所以， 1 MB 的堆表可以记录 1024 个 Free Space ，如果应用程序申请和归还内存块产生的 Free Space 不超过 1024 个的话， 1 MB 的堆表就够了。如果超过，则需要申请新的堆表空间。新的堆表空间在堆中申请。可以仍然申请 1 MB 。如果新申请的 1 MB 堆表空间用完了，可以继续申请 1 MB ，以此递推。当然，实际中不会等到堆表空间不够用时才去申请新的堆表空间，上文分析过，如果这样的话，会陷入 “自己描述自己” 的循环中，所以，应该在快用完（至少还足够保存一次申请产生的最大的 Free Space 变化 ( 包含索引项 ) ）的堆表空间时就申请新的堆表空间。

当应用程序第 1 次申请内存块时，堆管理程序会检查基础元数据区的第 1 个 div 的起始地址，若为 0 （div 不存在），就向操纵系统申请 div ，申请到后将 div 的起始地址记录到基础元数据区的 “第 1 个 div 的起始地址” 。

然后，将 div 的第 3 部分（用于分配的空间）作为 1 个 Free Space 记录入堆表（这是第 1 个 Free Space）。当然，记录的操作包括了建立索引。注意， 1 级索引项（00 , 01 , 10 , 11）固定存储在堆表的第 1 ~ 4 个堆表项位置。应用程序启动，初始化基础元数据区时应预先建好这 4 个索引项。

接下来，就开始在堆表中访问 Free Space 进行分配，当然现在只有 1 个 Free Space ，就是上面刚添加进去的 Free Space 。分配的话，就从 Free Space 的起始地址开始分配。比如，要申请 1 KB 的内存块，那么就把 Free Space 起始地址 ~ Free Space 起始地址 + 1 K - 1 这块内存分配给应用程序。如果申请的内存块大小比这个第 1 个 Free Space 都大，那么应该抛出异常 “只允许申请大小在 xx 范围内的内存块” 。

分配的具体工作：修改当前 Free Space 的起始地址，修改为 Free Space 起始地址 + 1 K ，同时修改索引，根据 Free Space 原来的起始地址遍历索引项，遍历到和新的起始地址不同的索引项就修改索引项。这么说好像不知道在说什么。好吧，我们举个具体的例子：

我们的设计是 64 位地址，举例的话就简单一点，我们以 8 位地址为例，假设 Free Sapce 的起始地址是 0 （0000 0000），申请 4 个字节大小的内存块。

申请前 Free Space 的索引是这样的： 00 -> 00 -> 00 -> 00 ，申请后 Free Sapce 的起始地址会变成 4 （0000 0100），相应的，索引会变成： 00 -> 00 -> 01 -> 00 ，可以看到，从第 3 个索引项开始，新的索引和旧的索引变得不同，所以我们从第 3 个索引项开始修改为新的索引项就可以了。

整个修改索引的过程会遍历全部的索引项（包含了修改）， 64 位地址是 32 个索引项，所以分配的时间复杂度约大于 O(32) （还要考虑其它的操作，所以是约大于），我们上文中就是这样估算的。

其它还有什么操作呢，好像没有了。 ^^

分配就 2 步操作： 1 修改 Free Space 起始地址， 2 修改索引。

接下来是归还，归还分为 4 种情况：

1 归还的内存块的前后不和已有的 Free Space 相接，这样归还会产生一个新的 Free Space 。

2 归还的内存块和前面或者后面已有的 Free Space 相接，这样需要和相接的 Free Space 合并。

3 归还的内存块和前面和后面已有的 Free Space 相接，这样需要和前后 2 个 Free Space 合并。

4 归还的内存块没有相邻的 Free Space ，这种情况比较特殊，这种情况就是整个 div 的内存完全被分配出去的情况。

具体流程是这样：

应用程序将内存块的起始地址提供给堆来归还这块内存块。堆根据内存块的起始地址查找索引，查找和内存块前相邻的 Free Space 。前相邻，是指相邻且在前面。什么是前面？ Free Space 的起始地址小于内存块的起始地址叫前面，大于叫后面。

根据索引查找到前相邻的 Free Space ，还不一定是真正的前相邻的 Free Space ，还要加一个判断条件： Free Space 所在的 div 和内存块所在的 div 是同一个 div ，这样才是前相邻的 Free Space 。

我们这样来定义前相邻后相邻：

前相邻：起始地址小于内存块的起始地址，且和内存块属于同一个 div ，则为前相邻。

后相邻：起始地址大于内存块的起始地址，且和内存块属于同一个 div ，则为前相邻。

如果查找不到前相邻，那么就根据基础元数据区里的 Free Space 链表头指针找到头指针指向的 Free Space 项，这个 Free Space 项就是内存块的后相邻。

如果 Free Space 链表头指针为空（0），也表示没有相邻（既没有前相邻，也没有后相邻）。

什么情况下 Free Space 链表头指针为空（0）呢？在应用程序初始化后，还没有分配的时候。以及分配以后，整个 div 都被分配出去。如果有多个 div ，所有 div 都被完全的分配出去，头指针也为空（0）。

头指针不空，可以找到起始地址大于或小于内存块起始地址的 Free Space ，但 Free Space 和内存块不在同一个 div 的话，也不是相邻。

怎么判断 Free Space 和内存块在不在同一个 div ？ Free Space 项有一个字段是所在 div 的起始地址， div 的第 1 个部分是 div 的结束地址（见上文对 div 的定义），根据 div 的起始地址可以找到 div 的结束地址，根据 div 的起始地址和结束地址可以判断内存块在不在 div 里。

找到前相邻后，判断前相邻的结束地址 + 1 和内存块的起始地址是否相等，若相等，则两者应合并。但这里还要进一步的判断，是情况 2 还是情况 3 ，所以还需要根据前相邻的 Next 指针找到下一个 Free Space 项，这就是后相邻。判断后相邻的起始地址和内存块的结束地址 + 1 是否相等，若相等，表示是情况 3 ，若不等，表示是情况 2 。

如果没有相邻的 Free Space ，就是情况 4 。如果有相邻的 Free Space ，但既不是情况 2 ，也不是情况 3 ，就是情况 1 。

对于情况 1 ，需要新建一个 Free Space 项，插入到 Free Space 项链表里，插入位置是内存块的前相邻之后，或者说，后相邻之前。当然，新建 Free Space 项需要建立相应的索引。索引有 32 个索引项，所以新建 Free Space 的时间复杂度约大于 O(32) 。再加上查找前相邻的时间复杂度 O(32) ，所以情况 1 的时间复杂度约大于 O(32) + O(32) = O(64) ，约大于 O(64) 。上文就是这样估算的。

对于情况 2 ，如果和前相邻相接，就修改前相邻的结束地址和索引就可以，如果和后相邻相接，修改后相邻的起始地址和索引就可以，这个和分配的操作方法一样，参考上文分配的部分就可以。

对于情况 3 ，可以修改前相邻的结束地址和索引，同时删除后相邻，相应的，后相邻的索引也要删除。删除索引的步骤是：根据后相邻的起始地址遍历索引项，对于只有 1 个子索引项的索引项删除即可。只有一个子索引项表示从当前索引项开始的索引路径仅仅指向要删除的这个后相邻。

对于情况 4 ，直接按照内存块的起始地址结束地址新建一个 Free Space 项，添加到 Free Space 堆表，当然会建立相应的索引。同时，还要将 Free Space 项插入 Free Space 项链表里。插入位置在 —— 根据索引查找出起始地址小于自己的 Free Space 项，插入到这一项之后就行。注：因为不在同一个 div ，所以不能叫前相邻或者后相邻。如果查找不到起始地址小于自己的，就插入到头，即基础元数据区里的 Free Space 链表头指针指向自己，自己的 Next 指针指向原来头指针指向的那一项。如果头指针原来是空（0），那就让头指针指向自己就可以了。

Free Space 项链表不是一个独立的东西，而是堆表里的 Free Space 项之间会通过 Next 指针来用链表的方式连接起来。因为只有 Next 指针，所以是单向链表。现在看起来，单向链表够用了。 -_- '

每次申请和归还后会检查是否进行垃圾回收，当满足以下 2 个条件时进行垃圾回收：

1 Append 指针到堆表结束地址的内存空间小于 1500 个字节时，

2 堆表的空闲空间超过堆表空间的 2/3 的时候

每次垃圾回收后会检查是否需要扩充堆表，当满足以下条件时扩充堆表：

Append 指针到堆表结束地址的内存空间小于 1500 个字节时，

扩充堆表就是申请新的堆表空间和初始空间用链表的方式连接起来，当然，随着堆的规模的扩大，可以申请第 2 个、第 3 个、第 n 个 …… 堆表空间，用链表的方式连起来就是：初始空间 -> 第 1 个新申请空间 -> 第 2 个新申请空间 -> 第 3 个新申请空间 -> …… 第 n 个新申请空间 -> ……

这一点的意义上面已经多次分析过，为了避免陷入 “自己描述自己” 的陷阱，所以需要在堆表空间快用完时，扩充堆表空间。堆表空间最少要能够存储一次分配（包含可能申请 div 的情况）所产生的 Free Space 项（包含索引项）。一般的分配只需修改 Free Space 项的起始地址和索引，当有申请 div 的情形时，会新建 Free Space 项及完整的索引（32 个索引项），这应该是分配时占用空间最大的情况，我们按这种情况来计算。上面说过， 1 个 Free Space （包含索引项）会占用 1122 个字节，我们放宽松一点，在堆表剩余空间只有 1500 个字节时就扩充堆表。

那什么时候 “压缩” 或者说释放空闲出来的堆表空间呢？

在垃圾整理后，检查最后一个 “不空” 的堆表空间，即最后一个存储了至少 1 个堆表项的堆表空间，如果这个堆表空间的空闲空间超过堆表空间的 2/3 ，那么将释放这个堆表空间之后所有的堆表空间。释放就是将堆表空间归还堆。上文说了，初始空间以外的堆表空间都是从堆里申请的。

初始空间不属于堆，显然，永远不会释放。

说到这里，显然， “堆表” 是一个可扩充的，由若干个线性表通过链表的方式连接起来的数据结构。

Append 指针指向的是最后一个堆表项，这个堆表项可能在初始空间，也可能在新申请的第 n 个堆表空间。

在分配时，会从当前 Free Space 项指针指向的 Free Space 项开始尝试分配，如果当前项大小不够，会访问下一个 Free Space 项，如果访问超过 10 个 Free Space 项还找不到大小足够的 Free Space ，则会向操作系统申请新的 div ，作为 Free Space 加入进来，然后在这个新的 div （新的 Free Space）中分配。

这主要是从执行速度的角度考虑。这也算是 “空间换时间” 。

这逻辑真的乱，烦。

我们可以用文件的方式来模拟实现这个堆管理算法。

就是用一个文件模拟一块内存区域，来实现这个堆算法。

我们会先实现一个 EnLargableList 的数据结构， EnLargableList 是一个线性表通过链表的方式连接起来的可扩充的数据结构，用来实现堆表。

堆的复杂来自于堆表的动态增长（无限增长），如果堆表是固定大小的，那么堆并不太难。

上面有一个地方的逻辑有漏洞，向操作系统申请了一个 div 之后，除了将 div 可分配的空间作为一个 Free Space 项加入 Free Space 项链表外，还应该新建一个 “空的” Free Space 项加入。这个 “空的” Free Space 项的起始地址和结束地址都是 div 的可分配空间的起始地址。因为起始地址和结束地址相等，所以是 “空的” 。因为大小是 0 ，总是小于申请的内存块的大小，所以，在分配的时候不会分配这个 Free Space 。

这个空的 Free Space 有什么用呢？这是为了解决整个 div 都被完全的分配出去的情况，上文分析过了，整个 div 都被完全的分配出去的话， Free Space 链表里就没有这个 div 的 Free Space ，这样当这个 div 里的内存块归还时，会找不到前相邻和后相邻，从而不知道这个内存块是哪个 div 的，这样归还的逻辑就有问题，就算不管是哪个 div 而直接将内存块作为 Free Space 归还，最终也会导致即使这个 div 已经全部空闲（所有分配出去的内存块都归还了），但是无法将这个 div 归还操作系统。相当于这个 div 处于 “半遗弃” 的状态。因为它的 Free Space 仍然可以继续分配和归还，但这个 div 已经不在正式名单上了，无法在全部空闲时归还操作系统。当然，实际中这样的操作是不允许的，因为 Free Space 项最后一个字段就是指向自己所在 div 的起始地址，就是说 Free Space 项应该知道自己所在的 div ，如果不知道，程序不能运行下去。

所以，每个 div 一定会有一个空的 Free Space ，不管 div 的空间如何分配，这个空的 Free Space 会一直存在下去，直到 div 归还操作系统，这个空的 Free Space 才会被删除。

因为我们没有专门的表来记录 div ，所以这个空的 Free Space 相当于 div 的代表，或者占位。

上面的做法还是有一点问题。用一个 “空的” Free Space 来表示 div 会有一些问题。实际上 “空的” Free Space 不是空的，是大小为 1 个字节的空间。起始地址和结束地址相等， Free Space 的大小 = 结束地址 - 起始地址 + 1 = 1 。所以，在归还 Free Space 时，如果归还的 Free Space 和这个 “空的” Free Space 相接，会和 “空的” Free Space 合并，这又会引出合并后下次分配时第 1 个字节不能分配（作为 “空的” Free Space）之类的判断，会把算法逻辑变复杂。

所以，我们放弃了这种方式。正统的做法应该还是把 div 记录到堆表里，也会为 div 建立索引。也就是说，增加一种堆表项： div 项。标识字节（第 1 个字节）为 3 表示 div 项。 div 项的第 2 ~ 9 个字节存储 div 的起始地址。当然 div 项的长度也是 34 （和索引项 Free Space 项相同），多余的字节不会用到。

这样，在归还内存块时，如果找不到前相邻，也找不到后相邻，说明 div 被完全分配出去了，此时就会根据索引查找 div ，找到起始地址小于内存块的起始地址且相邻的 div ，这就是内存块所在的 div 。

归还内存块后， div 的分配计数器会减 1 ，减 1 后检查计数器值是否为 0 ，若为 0 则 div 的空间已完全空闲，于是将 div 归还操作系统。

但这样的做法还是有问题，要为 div 建立索引，这有一点额外的麻烦，比如现在的堆表项开始的 4 个项位置存储的是 4 个 1 级索引项，如果要为 div 建立索引，需要专门再为 div 建立 4 个 1 级索引项，这些会增加算法内容，会变得复杂或者麻烦。

所以，我们还是回到用一个 “空的” Free Space 来表示 div ，或者占位的做法。在申请一个新的 div 的时候，会创建 2 个 Free Space ，一个是 “空的” Free Space ，另一个是可用的 Free Space 。 div 的开头会用 8 + 8 = 16 个字节分别表示结束地址和分配计数器 use Count ， “空的” Free Space 就是第 17 个字节，起始地址和结束地址都是第 17 个字节，从第 18 个字节开始就是可用空间了，可用的 Free Space 就是第 18 个字节开始到 div 的结束地址。

我们可以给 Free Space 项增加一个字节来表示 Free Space 的 “Type” ，在标识字节之后。第 1 个字节是标识字节，我们用第 2 个字节来表示 Free Space Type ， 0 表示 “空的” Free Space ， 1 表示普通的 Free Space 。这样的话， Free Space 项和索引项一样，都是 34 个字节了。

在分配和回收时需要判断 Free Space 时 “空的” Free Space 还是普通的 Free Space 。上文中定义过，标识字节为 2 表示普通的 Free Space 。

在分配时判断，如果是 “空的” Free Space ，就不进行分配，而是访问下一个 Free Space 尝试分配。

在回收时会寻找前相邻，如果前相邻是 “空的” Free Space ，则不进行判断是否相接若相接则合并的逻辑。

EnLargableList （用于堆表）会设定这样一些参数：

1 whenRecycleFragment ，这是一个整数，表示碎片数量超过多少应开始碎片回收，可以设置为 1万，碎片数量是以对表项为单位。假设堆表空间是 1MB ，每个堆表项占用 34 个字节，可以存约 3 万个堆表项，约表示 1024 个 Free Space （每个 Free Space 最多由 33 个堆表项表示，包含 32 个索引项 + 1 个 Free Space 项）。

如果设置 whenRecycleFragment 为 1 万，相当于是一个堆表空间中有 1/3 的空闲空间，此时回收。效果怎么样？不知道。

或者说相当于一个堆表空间中记录了 600 个 Free Space 项，还有 300 个 Free Space 的位置可以记录，此时回收。效果怎么样？不知道。

上文中提到当 Append 指针到堆表空间的结束位置的空间小于 1500 时回收，但现在放弃了这种做法。

因为这种做法好像不太科学，在应对规模很大的堆时候，好像不太适用。堆的规模很大，是指可以无限制的使用地址空间，内存块数量和 Free Space 数量（包含碎片）可能持续增长。大小 1MB 的堆表可以存约 3 万个堆表项，以堆表项为单位遍历一遍需要遍历 3 万个堆表项。 3 万是一个不小的数量，所以我们想当碎片（空闲出来的项位置）达到 1 万的时候回收可能会比较好。

2 whenEnLarge ，这是一个整数，表示 append 指针到堆表末尾的空间还有多少时扩充堆表容量，扩充堆表容量就是申请新的堆表空间，新申请的堆表空间以链表的方式连接到当前堆表空间。

3 heapTableSpace ：就是每一个堆表空间的大小，可以设为 1MB ，每次申请新的堆表空间就是申请 heapTableSpace 大小的一个内存块。

EnLargableList 还会保存这样一些字段：

1 appendPtr ， append 指针，存储一个 64位地址， EnLargableList 写入数据时从 append指针指向的数据开始写，每写入一段数据， append 指针会移动到这段数据之后的位置。

2 currentHeapTableSpace ，当前堆表空间，即 append 指针指向的位置所在的堆表空间。这个字段用来归还堆表空间。归还是指，当末尾一个堆表空间，即当前堆表空间的空间全部空闲出来时候，会将堆表空间归还堆。仅仅凭 append 指针不能知道 append 指针所在的堆表空间，所以还需要这个字段来记录 append 指针所在的堆表空间，即当前堆表空间。

3 recycleFreeItem ，碎片回收时指向空闲的项位置，即 “碎片” ，或者说 “已删除”的项。

4 recycleScanItem ，碎片回收时会先扫描 “碎片” ，扫描到一个 “碎片” 之后，会将 recycleFreeItem 指向这个 “碎片” 的位置。然后会扫描堆表项，每扫描一个堆表项，会检查堆表项的子项（子索引项 Free Space项），若子项的位置大于 recycleFreeItem 指向的位置，则将子项移动到 recycleFreeItem 指向的位置， “填补”这个碎片，同时修改当前扫描的堆表项中保存的该子项的位置。这样就完成一个 “碎片” 的回收（“填补”）。

然后就继续扫描下一个 “碎片” ，扫描到 “碎片” 后，又接着扫描上一次扫描的堆表项。怎么知道上一次扫描的堆表项？就是 recycleScanItem 指向的堆表项。不过这样看起来，还要加一个字段，来表示扫描到了堆表项里的哪个子项，如下：

5 recycleScanSubItem ，表示扫描到的堆表项的子项。这个字段只要 8 位整数就可以了。

6 fragmentCount ，表示 “碎片” 数量，每次删除堆表项时加 1 ，在碎片回收 “填补” 碎片的时候减 1 ，这个字段用于上文中如果 fragmentCount 的数量达到 whenRecycleFragment 的值的时候，就开始碎片回收。

7 堆表空间的 useCount ，这个字段是每个堆表空间保存 1 个，就是堆表空间的 useCount ，就是堆表空间使用的计数（以堆表项为单位）。每写入 1 个堆表项，就在堆表空间的 useCount 加 1 ，每删除 1 个堆表项， useCount 就减 1 。 useCount 为 0 表示堆表空间

每次分配和回收之后会检查 fragmentCount ，当 fragmentCount 超过 whenRecycleFragment 时会开始回收。由于不希望回收占用太多时间，可以设定一个参数比如 recycleItemCount ，比如 300 ，表示不管有没有回收完，只扫描 300 个堆表项。

但这样会有一个问题，本身要 fragmentCount 超过 whenRecycleFragment 时才开始回收，而且每次又不回收完，空闲出来的碎片空间得不到重复利用， append 指针只能一直向后移动，所以可能导致永远回收不完，堆表持续增长。

所以 ……

我们这里有了一个突破，即对于堆表的碎片回收，我们采用了一个新的算法，就是在堆表项里增加 1 个字段： fragmentNext 。

就是把已删除的堆表项（碎片）用链表的方式连接起来，这样每次写入堆表项的时候从这个链表的头取出一个碎片，作为新的堆表项的写入位置。 fragmentNext 表示下一个碎片的位置，或者说， fragmentNext 是一个指针，指向下一个碎片。

实际上是一个用链表实现的队列。

所以，需要在基础元数据区里增加 2 个字段 fragmentListHead , fragmentListTail ，用于保存碎片链表（队列）的头指针和尾指针。

每次删除堆表项时，将被删除的堆表项的标识字节更新为 0 ，表示已删除，同时将堆表项添加到碎片队列的尾部。

如果是第一次删除，那么碎片队列里还没有元素，则将头指针和尾指针都指向堆表项。

每次写入堆表项的时候，会先从碎片队列里取得碎片，作为写入位置，如果碎片队列为空，才会将 append 指针作为写入位置。

fragmentNext 指针也是一个 64位无符号整数 ( uInt64 ) ，所以也占用 8 个字节。这样的话，索引项和 Free Space 项的大小都是 34 + 8 = 42 个字节了。

好的，现在我们再来看看在这种算法下，如何回收碎片。（这里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

实际上，在这个算法下，碎片可以得到充分的利用（每次写入都优先从碎片队列中取得碎片作为写入位置，碎片队列为空才会用 append 指针的方式），所以看起来堆表不会无理增长。但又一些特殊的情况，比如应用程序先申请了大量的小块内存，造成了大量的 Free Space ，为了存储这些 Free Space ，堆表会变得很大，之后应用程序又归还了所有或者大部分内存块，也是 Free Space 会变得很少，此时堆表中就会产生大量空闲空间（碎片），这些空闲空间如果长时间不用又不归还堆，也是一种浪费。

我们可以这样来设计堆表的碎片回收算法：

首先，只有碎片数量大于某个值的时候，才会开始回收。比如大于 1000 个碎片（约 1 MB）。

从初始空间开始，向后遍历每一个堆表空间，如果堆表空间的 useCount 为 0 ，则可以考虑释放这个堆表空间（归还堆）。

注意，这里是考虑，不是一定要归还。还要判断一个条件，就是堆表的可用空间 usableSpace 是否足够，若足够则释放（归还）堆表空间，否则不释放。注意 usableSpace 是整个堆表的可用空间（包括所有的堆表空间）。

堆表的初始空间不属于堆，属于基础元数据区，永远不会释放。

所以在基础元数据区中要增加一个字段 usableSpace ，上文的一些算法逻辑也要做一些修改。

usableSpace 初始值等于初始空间的大小。之后每申请一个新的堆表空间，则加上新的堆表空间的大小，若归还堆表空间，则减去归还的堆表空间的大小。

每次向堆表写入数据， usableSpace 加上写入数据的长度，比如 1 个堆表项长度是 34 个字节，那么写入一个堆表项的话， usableSpace += 34; 。

每次从堆表中删除数据， usableSpace 减去删除数据的长度，比如删除 1 个堆表项，则 usableSpace -= 34; 。

上文中的 append 指针到堆表末尾的空间小于 1500 时应扩充堆表（申请新的堆表空间）这一段需要改成：

usableSpace 小于 1500 时，应扩充堆表（申请新的堆表空间）。上文中也提到如果一个堆表空间的 useCount 为 0 ，则可以考虑释放这个堆表空间，但要判断一个条件，即堆表的可用空间 usableSpace 是否足够。我们可以设定比如当 usableSpace - 当前考虑释放的堆表空间的大小 > 50 万个字节（可以存储约 500 个 Free Space 项 (包含索引项)）时，可以释放这个堆表空间。

我们上文设定的 1 个堆表空间的大小是 1MB ，所以 50万个字节约等于 0.5 MB ，上面的条件相当于是释放了这个堆表空间后，堆表的可用空间还有 0.5 MB ，也就是相当于还有半个堆表空间。

这些参数可以根据需要进行设定，上面给出的是参考数值，也是举例。

归纳一下，就是 usableSpace 小于 1500 时应扩充堆表， usableSpace - 考虑释放的堆表空间大小大于 50万时可以释放堆表空间。

是不是更清晰了？

碎片回收应放在一个另外的线程里进行。（是不是想起了 GC -_- ' ），每隔一段时间运行一次（比如每秒运行一次），如果堆表空间的数量很大，可以每次只遍历几个堆表空间（比如 10 个），后面的下次继续遍历。这样可以不影响分配和回收内存块的执行速度。

（这里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

为了能在更新索引时只上溯到索引项值不同的索引项，需要再在索引项和 Free Space 项里再增加一个字段， parentItem ，保存上一级索引项的地址，是一个 ulong 无符号长整型，占 8 个字节，这样，索引项和 Free Space 项的长度就是 42 + 8 = 50 了。

更新索引时只上溯到索引项值不同的索引项，可以避免为了更新一个 Free Space 项的索引项而删除这个 Free Space 项的全部索引项并重建全部索引项。删除全部索引项再重建可能会比较省事一些，但效率上可能会低一点。

上溯的逻辑是检查上一级索引项的索引值和新索引在这一层级的索引项的索引值是否相等，如果相等，则在这一级索引项上开始向下建立新索引的索引项，如果不等，则检查这个 “上一级” 索引项除了当前索引项以外还有没有其它子项，如果没有，则删除这个 “上一级” 索引项之后继续上溯，如果有，则直接继续上溯。删除 “上一级” 索引项当然包括了删除当前索引项，实际上，上溯是从 Free Space 项开始， Free Space 项是索引树的最底层，也可以说是叶子节点，也可以说是索引最终指向的数据，或者说数据项。

实际上 “上溯” 这个逻辑好像行不通，因为上溯到索引值和新索引在这一层级的索引值相同这并不能说明更上层的索引值和新索引的对应相同。要知道更上层（或者说每一层）的索引值是否和新索引的对应相同，需要一直上溯到顶层（一级索引），但这和从一级索引自顶而下好像没什么区别。啊哈哈

为了简单起见，我们采用删除旧索引，建立新索引的方式。即更新索引采用删除旧索引建立新索引的方式。

我们来看一下这样的做法的时间花费：

对于申请内存块（new），需要更新用于分配内存块的 Free Space 的索引，按照上述的做法，更新包括了删除旧索引和建立新索引，删除旧索引和建立新索引的时间复杂度都可以认为是 O(32) ，加起来就是 O(32) + O(32) = O(32 + 32) = O(64) 。按照我们在上面的估算方法， O(1) 的时间按 4ns （4纳秒）算，那么申请内存块（new）的时间花费就是 64 * 4 = 256 ns 。 256 ns 我们按 300ns 算的话， 1 微秒就可以执行 3.3 次 new 操作， 1 秒就可以执行 330 万次 new 操作。因为我们将 256 ns 近似为 300 ns 计算，所以可以认为 1 秒可以执行 330 万次以上的 new 操作。

对于归还内存块（delete），分为 4 种情况：

情况 1 ：归还的内存块前面和后面都不和已有的 Free Space 相接，所以不需要 “合并”，这样只需要新建索引就行，时间复杂度是 O(32) ，时间花费是 32 * 4 = 128 ns ，可以估算为 1 微秒可以执行 7 次，那么 1 秒可以执行 700 万次。

情况 2 ：归还的内存块前面和已有的 Free Space 相接，需要 “合并”。合并只需更新相接的 Free Space 的结束地址就行。因为索引是按 Free Space 的起始地址建立的，所以更新结束地址不需要更新索引，所以情况 2 的时间复杂度是 O(1) ，由于只是更新结束地址，可以认为 O(1) 的时间花费是 1 * 1ns = 1ns ， 1 秒可以执行 10 亿次。我也有点怀疑，真的这么简单吗？

情况 3 ：归还的内存块后面和已有的 Free Space 相接，需要 “合并”。合并只需更新后面相接的 Free Space 的起始地址，由于索引是按起始地址建立的，所以需要更新索引，和申请内存块一样，更新索引包含删除旧索引和建立新索引，时间复杂度是 O(64) ，时间花费是 64 * 4 = 256ns ， 1 秒可以执行 330 万次以上。

情况 4 ：归还的内存块前面和后面都和已有的 Free Space 相接，需要将前面后面的 Free Space “合并” 为一个。合并需要修改前面的 Free Space 的结束地址，删除后面的 Free Space 。修改结束地址不需要更新索引，所以只需要删除后面的 Free Space 的索引就行。所以时间复杂度是 O(32) ，和情况 1 一样，时间花费是 32 * 4 = 128 ns ， 1 秒可以执行 700 万次。

哎？我刚又想到一个好主意，申请内存块的时候为什么不从 Free Space 的结束地址分配呢？如果从 Free Space 的结束地址分配的话，就不用更新索引，只要修改 Free Space 的结束地址就可以了。这样就和归还的情况 2 一样，时间复杂度是 O(1) ，时间花费是 1 * 1ns = 1ns ， 1 秒可以执行 10 亿次。（1 秒可以 new 10 亿次）

上面的讨论是从起始地址开始分配内存块的，所以每次 new 的时候会更新起始地址，也就会更新索引。

如果换成从结束地址一端来分配内存块的话，就不需要更新起始地址，也就不需要更新索引，可以大大提高效率。

当然这是在 Free Space 的大小足够分配的情况下，如果 Free Space 的大小不够，会向后寻找 Free Space，若寻找了 10 个 Free Space 还未找到大小足够的 Free Space，则会向操作系统申请 div 。在这些情况下，还需要考虑这些时间花费。

因为不需要上溯，所以索引项和 Free Space 项不需要保存上一级索引项的位置（地址），也就是不需要 parentItem 这个字段，这样的话，索引项和 Free Space 项的长度就从 50 个字节变回 50 - 8 = 42 个字节了。

实际上，我们在索引项里设计了一个字段用来保存索引值，但后来发现，由上一级索引保存的 4 个子索引项的指针字段可以直接指向子索引项，子索引项好像不需要保存索引值。

我这个设计是不会回收堆里的碎片的。这跟 C# Java 之类有 GC 的不同。我想 C++ 也不会回收堆里的碎片。上文提到的 “碎片回收” 是回收堆表里的碎片，不是回收堆的碎片。所以不存在 “全盘整理” 。每次归还内存块的时候会检查 div 的 useCount ，每次分配内存块的时候，这个内存块所在的 div 会 useCount ++ ，每次归还内存块，这个内存块所在的 div 会 useCount -- 。如果 useCount == 0 ，则将 div 归还操作系统。但这种情况概率可能不大，因为一旦 div 投入使用后，分配出去的内存块必须全部释放， div 才会空（useCount == 0），才能归还操作系统。但在实际使用中， div 投入使用后，有申请有归还，全部清空的概率可能不大，很长时间后，可能还有一些 “零碎” 的内存块占据着，即使是少量的内存块，也导致 div 不能归还。这就是 C++ 这一类静态做法的局限。可能导致大块内存区域（div）被进程占据，无法回归到操作系统层面，造成资源的浪费。

所以，要解决这种静态做法的局限，就需要引入 GC 这样的动态特性。我想，当初 GC 的出现（以 Java 为代表），不仅仅是为了解决 “内存泄漏” 的问题，其实也隐藏了上述静态做法的种种局限的原因吧！

当然， GC 的做法会增加工作量，会花费时间，但是， GC 确实可以有效的控制堆碎片数量和堆表大小。就是说， GC 可以使堆碎片控制在一个有限的范围内，使堆表大小控制在一个有限的范围内，这本身就简化了问题，减少了管理开销和复杂度。从这个角度来讲， GC 又是减小了时间花费，提升了效率的。

所以，从技术进步或者进化的角度来看， GC 是一次进化，使得可以用更现代更高级的方法来管理存储资源。

相较之下， C++ 的静态做法，是早期和朴素的。

在现代存储资源可以大幅甚至无限扩展的情形下，或许确实需要 GC 这样 “动态” 的方式来管理存储资源。静态的方式面对大幅存储资源可能会有局限。

当然，在本文中设计的这种 “静态”做法，实际上也是利用了现代存储资源大幅提升的特点，比较多的应用了 “空间换时间” 。

但确实存在一个问题，就是静态的做法无法控制碎片的增长，包括堆碎片，甚至堆表碎片，或者说不能有效控制堆表大小的增长。本文的做法可以回收堆表碎片，但是效果如何，不知道。只要堆表空间里还有一个堆表项，就不能释放堆表空间（归还堆），这是一个概率问题。

所以，要准确有效的管理存储资源，还是需要 GC 这样的 “动态” 做法。

所谓 “动态”，套用一个术语， GC 建立了一个 “抽象层” 。

因为有这个 “抽象层”， GC 可以移动进程中的变量位置，而对于程序来讲，没有感觉到变化。

也正因为这样， GC 可以有效的控制堆碎片的数量和堆表大小在一个有限的范围。

在 C++ 里，由于 C++ 比较直接的面向 “底层”（操作系统），所以， C++ 不能提供 GC 这样的 “抽象层”，对于堆管理，也就只能使用 “静态”的做法，如上所述。

但到目前为止，上面说的设计解决了基本的分配和回收（包括索引机制，索引机制确保了检索操作的时间花费在一个已知的范围内），但还存在一个重要的问题，就是 “碎片占据 div” 的问题。就是说， div 里只要还有一个内存块没有归还， div 就会被进程一直占用，不能归还操作系统。这就导致大块内存空间的浪费。这是一个大问题。

有网友查了资料，说 Linux 有一块 3G 的用户空间，进程可以使用，使用这个用户空间不需要系统调用（不需要切换到系统进程，即不需要跨进程）。我的理解是这是操作系统提供的系统级的一个 “公共堆”，可供所有进程使用。这样在 3G 的范围内，进程可以共用这个公共堆，这样可以解决 “碎片占据 div” 的问题。

所以，我说这是个重大发现。

但后来一想，这样又有一个问题，就是地址访问的时候不能或者难于作安全检测了，所谓安全检测，是指检查访问的地址是否越界。越界指访问了其它进程的内存。

资料显示，现在的安全检测是在存储管理部件中完成的。这是一个硬件，是 CPU 的一部分。

操作系统为存储管理部件设置页表，然后存储管理部件就可以工作了。

看起来，公共堆没有 “段” 的概念，大概很难实施判断是否越界的安全检查。

呀，这可怎么办？

碎片，分为 2 个层面，

1 物理内存，页文件

2 虚拟内存，虚拟地址

对于 1 ，操作系统可以进行整理，可以将多个页上的零碎的数据整理到一个页，再把虚拟地址映射到新的页就行。这样可以避免频繁的载入载出页。

对于 2 ，需要程序自己管理。比如 GC ，内存池。

但上面的说法也有一点问题，操作系统（虚拟内存）也不能整理数据层面的碎片，因为虚拟内存管理的是虚拟页和物理页之间的对应关系，并没有细化到虚拟地址和物理页之间的对应关系，所以虚拟内存也不能整理数据层面的碎片，上面说的 “将多个页上的零碎的数据整理到一个页” 这是不能做到的。

操作系统（虚拟内存）只能删除空页（没有数据在用的页）。

而只要页上还有数据在用，那么，即使数据占用的空间很小，这个页也不能被删除。

所以，从这个角度来看，如果程序产生了很多的碎片，那么可能导致操作系统（虚拟内存）频繁的载入载出页。

堆在计算机系统结构里的地位等同于虚拟内存和文件系统。

漫谈 C++ 的 内存堆 实现原理

漫谈 C++ 的内存堆实现原理