索引以及查询结构

索引

什么是索引

搜索引擎索引是一个特殊的数据结构其存储的是数据的关键信息和详细信息的位置对应关系

例如书的目录

为什么需要索引

加速查询，当数据量非常大的时候，查询某一个数据是非常慢的

索引的影响

不是说有了索引就能加速，得看你的查询语句有没有正确使用索引
索引也需要占用额外的数据空间
添加索引后将导致，增删改变慢--写入

什么样的数据应该添加索引：

查询操作较多写入较少并且数据链很大时

查询和写入操作的占比，10:1或者查询更多

本质上索引原理是尽可能的减小索引范围，降低IO操作

磁盘IO

平均查找一个数据需要花费至少9ms 这段是CPU 就会切换到其他的程序

我们要加速查询必须至少IO操作的次数

索引数据结构

b+树

在b+树种，叶子结点才是存储真实数据的，叶子数量越多，树的层级越高，导致IO次数增加

要避免这个问题，在叶子节点尽可能的存储更多的数据，应该将数据量小的字段作为索引

最左匹配原则

当b+树的数据项目是复合的数据结构，比如(name，age，sex)的时候（多字段联合索引），b+树会按照从左到右的顺序来建立搜索树，比如当（张三，20，F）这样的数据来检索的时候，b+树会优先比较name来确定下一步的所搜方向，如果name相同再依次比较age和sex，最后得到索引的数据；但当（20，F）这样的没有name的数据来的时候，b+树就不知道下一步该查那个节点，因为建立搜索树的时候name就是第一个比较因子，必须要先根据name来搜索才能知道下一布去哪里查询，比如当（张三，F）这样的数据来检索的时候，b+树可以用name来制定搜索方向，单下一个字段age的缺失，所有只能吧名字等于张三的数据都找到，然后匹配性别是F的互数据，这个是非常重要的性质，即索引的最走匹配特性

聚集索引

聚集索引中包含了所有字段的值，如果制定了主键，主键就是聚集索引，如果没有则找一个非空且唯一的字段作为聚集索引，若果也找不着，自动生成一个字段作为聚集索引

辅助索引

除了聚集索引以外的都叫辅助索引

辅助索引中包含了当前的索引字段和主键的值

覆盖查询

指的是在当前索引结构中就能找到所有需要的数据，如果使用的聚集索引迎来查询那么一定是覆盖查询，速度是最快的

回表查询

指的是在当前索引结构中找不到所需的数据，需要听过id去聚集索引中查询，速度慢与聚集索引

结论

使用占用空间最小的字段来作为索引
不要在一行中存储太多的数据，比如视频，字段太多可以分表
尽量使用覆盖查询
如果字段区分度低（重复度高），建立索引是没有意义的，反过来说应该将区分度高的字段作为索引
模糊匹配中，百分号尽量不要写在前面
不要在等号的左边做运算

例如： select count(*) from user where id * 3 = 6;也会遍历所有记录
and语句中会自动找一个具备缩印的字段优先执行，所以我们应该在and语句中至少包含一个具备索引的字段
or语句要避免使用，如果要用则保证所有的字段都有索引才能急速
联合索引中，顺序应该将区分度最高的放到左边，最低的放右边

查询语句中必须保证最左边的索引出现在语句中

另外需要注意的如果要查询的数据量非常大，索引无法加速

总结：不是添加了索引就能提速，需要考虑索引添加的是否合理，sql语句是否用到了索引

语法

创建索引的语法：

create index 索引的名字 on 表名（字段名）

联合索引

create index 索引的名字 on 表的名字（字段名，字段名）

create index union_index on usr（id，email，name，gender）

删除索引

drop index 索引名称 on 表名称