<数据结构>笔记1-【B树和索引】

一、二叉排序树(二叉查找树)

空树或具有下列性质的二叉树
1.左子树所有节点值小于根节点
2.右子树所有节点大于根节点
3.它的左右子树分别为二叉排序树

二、平衡二叉树(AVL树)

  • 满足二叉排序树
  • 左右子树高度相差不超过1

三、B-树

  • 平衡
  • 多路排序树
  • 主要用于文件索引
    B-树

1. 特性:

1)所有非终端节点包含以下信息(key-value paris)

(n,A0,K1,A1,K2,A2...Kn,An) **
Ki--关键字
Ai--指向子树根节点指针
n--关键字个数

2)所有叶节点出现在同一层,包含关键字 或 指向关键字记录的指针

关键字记录?

关键字key为记录的主键,只是记录的一部分。

wikipedia for B-tree

The term leaf is also inconsistent.
Bayer & McCreight (1972) considered the leaf level to be the lowest level of keys, but Knuth considered the leaf level to be one level below the lowest keys (Folk & Zoellick 1992, p. 363).
There are many possible implementation choices.
In some designs, the leaves may hold the entire data record;
in other designs, the leaves may only hold pointers to the data record. Those choices are not fundamental to the idea of a B-tree.[5]

《数据结构》严蔚敏版 此处有误

3)树中每个节点保存值

B-trees keep values in every node in the tree, and may use the same structure for all nodes.

2. B-树查找分析

通常存储在磁盘

两步操作:

1) 找节点(磁盘)

磁盘随机找到p所指节点,并将节点信息读入内存

2) 节点中找关键字(内存)

顺序查找或折半查找关键字

四、B+树

A B+ tree can be viewed as a B-tree in which each node contains only keys (not key–value pairs), and to which an additional level is added at the bottom with linked leaves.

note

12..34..567 are leaves,d1~d7 are not——they are data record.

A simple B+ tree example linking the keys 1–7 to data values d1-d7

与B-树不同点:

1. 所有叶子节点

1). 包含 全部关键字
2). 包含关键字记录指针,如上图12..34..567
3). 叶子节点升序顺序链表链接

@Wikipedia-Btree

2. 非终端节点(即索引)只含关键字,非B树的关键字-指针对
3. 其他
  • n棵子树含n个关键字
  • 两指针与查找:
  • root节点指针-->随机查找(必须,搜索总是从root节点开始,代替全表扫描)
  • 最小关键字叶子节点指针-->顺序查找

五、文件

1. 记录2种结构

逻辑结构和物理结构

2. 文件3种检索方式

顺序检索

存取下一个逻辑记录

直接检索

存取第i个逻辑记录

关键字检索

查询与关键字相关记录

六、 索引文件

1. 索引表

记录逻辑记录物理记录对应关系

索引项
  • 定义:索引表中的项
  • 索引项关键字或逻辑记录号排序

2. 索引文件

索引文件只能是磁盘文件

1)定义:

文件数据区+索引表

2)分类:

索引顺序文件--数据区有序
索引非顺序文件--数据区无序

3)索引文件检索

两步骤:

  1. 索引表(折半)
  2. 查记录(依据索引项)
  • 数据小--索引表在内存,记录在外存
  • 数据大--索引、记录均在外存
原文地址:https://www.cnblogs.com/pennli/p/8795082.html