为什么索引可以提高效率?

为什么索引可以提高效率?

  对于索引的应用比较常见,索引的底层数据结构也有一定的了解,但是一直在思考为什么索引会提高效率,后来,参考网上的文章,终于得到解释。

============================================================

  本文只针对mysql进行相关方面的说明。

  首先我要问,“数据索引是有序无序的?”。答:“当然是有序的了。”

  再问,一个SQL语句可以有几个索引?你先别往下看结果,你这想下,可以使用几个索引呢?正确的是:“1个”。有人肯定会疑惑。对,当初我接受这个概念也是挺纳闷的,后来在实际中得到了解答。那么,你需自己找答案了。

  在有序的情况下,通过索引查询一个数据是无需遍历索引记录的;

  极端情况下,数据索引的查询效率为二分法查询效率,趋近于 log2(N);

  在进行索引分析和SQL优化时,可以将数据索引字段想象为单一有序序列,并以此作为分析的基础。

  如以下的SQL,如何进行优化呢?

1
select from user where area=’$area’ and sex=’$sex’ order by lastlogin desc limit 0,30;

  假设,这是在高访问量的情况下,高频率的情况下如何进行优化?答:建立复合索引.

  area+sex+lastlogin 三个字段的复合索引,如何理解?

    1 如果只使用area会怎样?搜索会把符合area的结果全部找出来,然后在这里面遍历,选择命中sex的并排序。 遍历所有 area=’$area’数据。

    2 如果使用了area+sex,略好,仍然要遍历所有area=’$area’ and sex=’$sex’数据,然后在这个基础上排序。

    3 Area+sex+lastlogin复合索引时(切记lastlogin在最后),该索引基于area+sex+lastlogin 三个字段合并的结果排序。

  

      不知道到这你是否看明白没有??这个不妨你在本地打个环境。自己动手试试看。

  下面我用我自己的工作中的案例说下,这索引前后的区别:

  我们有个业务需求是这样的:

SELECT * FROM `cu_banuser` WHERE uid =386264 AND fid =2 ORDER BY `endtime`

   1 这是一张表结构 如图。此表只有一个主键作为索引。

  那么我们用explain看下吧: 关于explain,强烈建议:请大家自己baidu,有必要去了解认识它。

EXPLAIN SELECT * FROM `cu_banuser` WHERE uid =386264 AND fid =2 ORDER BY `endtime`

  下面的是其explain的结果:

  看到其中的 type possible_keys 尤其是rows了吗?影响的结果集是2751行。

2 我们现在将UID做为索引:

  再explain下:

  看划线的,你们会惊喜的发现 rows已经是2了。证明我们的努力没有白费。

3 我们继续添加剩下的索引fid;

  好,我们再explain下,看结果:

  你会发现什么呢?呵呵,对了 rows=1了。

4 继续给endtime加索引

  explain看下:

  我们的rows=1了,很明显的如果在大数据量的情况下,我们的获得的成果是很可喜的!我们一切从大数量出发。

  好,不知道你注意到开篇就提到的2个问题吧?第二个问题是什么?一个sql用几个索引?答案是1个。

  看到这,不知道你有没有感悟出来呢?我们在实际工作中用到最多的就是复合索引!

 

 

  这就是你为什么看到上图的框中的索引是这么建的!

 

  补充下 从最好到最差的连接类型为 :const、eq_reg、ref、range、index和ALL  

综上所述:

  1 一个sql只用一个索引;

  2在实际工作中用到最多的是复合索引;

  3 复合索引有严格的顺序之分;

  4 遵循偏左原则

原文地址:https://www.cnblogs.com/Demrystv/p/9377213.html