B-+树



B-树

B树是二叉平衡树的升级版,可以多路自平衡,而且属于外查找,即数据是放在外存之中的,这时候就要考虑 IO 操作优化了,相比二叉查找树他们的时间复杂度都是O(log N),优势在于B树的深度相比小很多,在数据很大的情况下从磁盘读取次数小了,加快了查找速度,所以B树及其同类经常用在文件系统或数据库中,下面先来说一下B树

  • B树的节点中含有孩子的最大值称为该树的阶,通常用m表示,(m >= 2)
  • 若根节点不是叶子结点,则根节点最少有两颗子树
  • 树中每个中间结点都包含k-1个元素和k个孩子,ceil(m/2) <= k <= m
  • 树中叶子节点都包含k-1个元素,ceil(m/2) <= k <= m
  • 所有的叶子结点都位于同一层



B+树

B+树又是B-树的升级版,一颗m阶的B+树,在B-树的前提下又有下面的区别:

  • 根节点的最大元素是整棵树的最大元素

  • 中间节点有多少个孩子,就有多少个元素(元素不保存数据了,只用于索引,所有数据都存在叶子节点中)

  • 所有中间结点的元素都同时存在于子节点上,且在子节点元素中是最大(最小)元素

  • 所有叶子节点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子节点按照关键字组成链表



二者区别

  • B+树中只有叶子节点才有指向数据记录的存储地址,B-树的节点则都有
  • B+树因为中间元素没有数据记录的存储地址,同样的磁盘页可以存储更多节点元素(即同样元素,B+树更矮,IO次数更少)
  • B+树单查询必须查到叶子节点,因为叶子才有数据记录的存储地址,而B-树则查到就返回,不稳定
  • B+树范围查询只需在叶子节点遍历链表即可,而B-树需要中序遍历才能确定范围


原文地址:https://www.cnblogs.com/Howlet/p/12255418.html