mysql索引剖析

讲索引之前让我们先看看一些常见的数据结构

1.hash

概念:是把任意长度的输入（又叫做预映射pre-image）通过散列算法变换成固定长度的输出，该输出就是散列值

时间复杂度和空间复杂度:O(1)

缺点:hash索引不支持范围查找,不支持排序

优点:时间复杂度低

比如现在hash表中有7条数据,要查询id为7的数据只需要一次就能查到,如下图

2.二叉树

特点:左子树都比父节点小,右子树都比父节点大

让我们来看看二叉树的查找

平衡二叉树

可见查询id为7的数据要比全表扫描要好.

但是如果我们从1开始插入数据的话,那么二叉树应该长这样

　　　　　　　　　　不平衡二叉树

显然,查找id为7的数据也需要7次,跟我们不建立索引是一样的效果

缺点:存在不平衡问题

如果二叉排序树是平衡的，则n个节点的二叉排序树的高度为Log2n+1,其查找效率为O(Log2n)，近似于折半查找。如果二叉排序树完全不平衡，则其深度可达到n，查找效率为O(n)，退化为顺序查找。一般的，二叉排序树的查找性能在O(Log2n)到O(n)之间。因此，为了获得较好的查找性能，就要构造一棵平衡的二叉排序树。

3.红黑树

概念:在进行插入和删除操作时通过特定操作保持二叉查找树的平衡，从而获得较高的查找性能

看一下红黑树的插入过程