数据库索引操作

索引

什么是索引

可以理解为: 搜索引导,索引是一个特殊的数据结构,其存储的是数据的关键信息与详细信息的位置对应关系  

例如:书本的目录

为什么需要索引

加速查询,当数据量非常大的时候,查询某一个数据是非常慢

索引的影响

1.不是说有了索引就能加速,得看你的查询语句有没有正确使用索引  

2.索引也需要占用额外的数据空间  

3.添加索引后 将导致,增减删除修改变慢  (写入)

什么样的数据应该添加索引:

查询操作较多写入较少并且数据量很大时

查询与写入操作的占比,10:1 或者查询更多  

本质上索引原理是尽可能的减小搜索范围

磁盘IO

平均查找一个数据需要花费至少9ms 这段是CPU 就会切换到其他的程序 ,

我们要加速查询,必须较少io操作的次数

索引数据结构

b+树

在b+树中叶子节点才是存储真实数据的,叶子数量越多,树的层级越高,导致IO次数增加

要避免这个问题,在叶子节点中尽可能的存储更多的数据, 应该将数据量小的字段作为索引

最左匹配原则

当b+树的数据项是复合的数据结构，比如(name,age,sex)的时候(多字段联合索引)，b+树会按照从左到右的顺序来建立搜索树，比如当(张三,20,F)这样的数据来检索的时候，b+树会优先比较name来确定下一步的所搜方向，如果name相同再依次比较age和sex，最后得到检索的数据；但当(20,F)这样的没有name的数据来的时候，b+树就不知道下一步该查哪个节点，因为建立搜索树的时候name就是第一个比较因子，必须要先根据name来搜索才能知道下一步去哪里查询。比如当(张三,F)这样的数据来检索时，b+树可以用name来指定搜索方向，但下一个字段age的缺失，所以只能把名字等于张三的数据都找到，然后再匹配性别是F的数据了，这个是非常重要的性质，即索引的最左匹配特性。

聚集索引

聚集索引中包含了所有字段的值,如果拟制定了主键,主键就是聚集索引,如果没有则找一个非空且唯一的字段作为聚集索引,如果也找不着,自动生成一个字段作为聚集索引

聚集索引中存储了所有的数据

辅助索引

除了聚集索引以外的都叫做辅助索引

辅助索引中只包含当前的索引字段和主键的值

覆盖查询

指得是在当前索引结构中就能找到所有需要的数据  ,如果使用的是聚集索引来查询那么一定覆盖查询,速度是最快的

回表查询

指得是在当前索引结构中找不到所需的数据,需要通过id 去聚集索引中查询 ,速度慢与聚集索引

索引结论

1.使用占用空间最小的字段来作为索引

2.不要再一行中存储太多的数据,例如小说,视频,如果字段太多可以分表  

3.尽量使用覆盖查询  

4.如果字段区分度低(重复度高),建立索引是没有意义,反过来说应该将区分度高的字段作为索引

5.模糊匹配中,百分号尽量不要写在前面

6.不要再等号的左边做运算

例如:select count(*) from usr where id * 3 = 6; 也会遍历所有记录

7.and语句中会自动找一个具备缩印的字段优先执行,所以我们应该在and语句中至少包含一个具备索引的字段

8.or语句要避免使用,如果要用则保证所有字段都有索引才能加速

9.联合索引中,顺序应该将区分度最高的放到左边,最低的放右边,

查询语句中必须保证最左边的索引出现在语句中

另外需要注意:如果要查询的数据量非常大 索引无法加速

总结: 不是添加了索引就能提速,需要考虑索引添加的是否合理,sql语句是否使用到了索引

创建索引语法

创建索引的语法:

create index 索引的名字  on 表名称(字段名)

联合索引

create index  索引的名字  on 表名称(字段名,字段名)

create index union_index on usr(id,email,name,gender);

删除索引:

drop index 索引名称 on 表名称;

数据库 索引操作

索引