mysql数据库索引调优

一、mysql索引

1、磁盘文件结构

  innodb引擎:frm格式文件存储表结构,ibd格式文件存储索引和数据。

  MyISAM引擎:frm格式文件存储表结构,MYI格式文件存储索引,MYD格式文件存储数据

2、mysql数据库数据范问原理(innodb、BTREE)

  (1)ibd文件中主键构建b+tree,主键树的叶子结点包含了所有的主键值,存储主键值和对应的表数据

  (2)其他索引构建b+tree,树的叶子结点包含了所有该索引字段的值,存储索引值和主键值。

  原理图如下图所示:

      

3、索引类型

  普通索引:无任何限制的索引
  唯一索引:列值唯一的索引,可以为空值
  主键索引:表的主键,特殊的唯一性索引,不能为空值
  组合索引:多个字段上的索引,遵循左前缀集合
  全文索引:来查找文本中的关键字

4、使用explain+sql语句进行调优

    (1)explain包含的信息包含:

  

       主要从id、type、key、rows、Extra分析。

     (2)id

   表示执行的先后顺序,id值大的先执行,小的后执行,id值相同的从上到下执行。

     (3)type

   访问类型,结果值从好到坏依次是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL。

   建议尽量达到range级别,常见类型介绍如下:

   const:通过索引一次找到,通常用于主键或唯一性索引。

   eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键 或 唯一索引扫描。

   ref:非唯一性索引扫描,返回匹配某个单独值的所有行。

   range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了那个索引。一般就是在where语句中出现了bettween、<、>、in等的查询。

   index:Index与ALL虽然都是读全表,但index是从索引中读取,而ALL是从硬盘读取。

   all:Full Table Scan,遍历全表以找到匹配的行 。

  (4)key

    实际使用的索引,如果为NULL,则没有使用索引。查询中如果使用了覆盖索引,则该索引仅出现在key列表中 。

  (5)rows

    根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。

  (6)Extra

    Using index: 表示相应的select操作中使用了覆盖索引(Covering Index),避免了访问表的数据行,效率高 。Using where,表明索引被用来执行索引键值的查找,如果没用同时出现Using where,表明索引用来读取数据而非执行查找动作。

    Using  where:表示使用了where条件过滤。

    Convering Index:覆盖索引表示直接从索引中读取数据,sql中查询字段、where条件等涉及的字段都在覆盖索引包含的字段里面。

    Using Index Condition:优化器在索引存在情况下通过符合range范围的条数和总数比例来确定进行索引还是全表遍历。

    Using filesort:无法利用索引完成的排序操作。

    Using temporary:使用临时表保存中建结果,如order by和group by,出现临时表需要优化sql。

5、组合索引

  (1)使用组合索引时需要遵循索引最左匹配原则,使用了最左原则type可以为eq_ref (组合索引为唯一索引)、ref、index,可以使用算法来

查询索引值。如果组合索引为(a,b),使用where a ='value'或者where a ='value' and b='value1'时type为ref。

  (2)使用组合索引时需要遵循索引最左匹配原则,没有使用了最左原则type可以为index,直接扫描索引全表查找索引值。如果组合索引为(a,b),使用where b ='value1'或者where a ='value' or b ='value1' 时type为index。

  (3)组合索引和多个单列索引

    在(a,b,c)3列上建立组合索引和3个单列索引时,where条件为a、b、c3列时,组合索引性能更优,3个单列索引只会走一个最优的单列索引。

6、mysql不走索引的原因                                

  1) 没有查询条件,或者查询条件没有建立索引。

  2) 在查询条件上没有使用引导列。

  3) 查询的数量是大表的大部分,应该是30%以上。

  4) 索引本身失效。

  5) 查询条件使用函数在索引列上,或者对索引列进行运算,运算包括(+,-,*,/,! 等)

    错误的例子:select * from test where id-1=9; 正确的例子:select * from test where id=10。

  6) 对小表查询。

  10)隐式转换导致索引失效.这一点应当引起重视.也是开发中经常会犯的错误。

    由于表的字段tel_num定义为varchar2(20),但在查询时把该字段作为number类型以where条件传给数据库,这样会导致索引失效,

    错误的例子:select * from test where tel_nume=13333333333;正确的例子:select * from test where tel_nume='13333333333'。

  11) 注意使用的特殊符号

       1、<>  、!=。

       2、单独的>,<,(有时会用到,有时不会)。

  12)like "%_" 百分号在前.

    select * from t1  where name like 'linux培训%'。

  13) not in ,not exist。

  15)当变量采用的是times变量,而表的字段采用的是date变量时.或相反情况。

  16)B-tree索引is null不会走,is not null会走。

  17)联合索引 is not null 只要在建立的索引列(不分先后)都会走

    in null时 必须要和建立索引第一列一起使用,当建立索引第一位置条件是is null 时,其他建立索引的列可以是is null(但必须在所有列 都满足is null的时候),或者=一个值;当建立索引的第一位置是=一个值时,其他索引列可以是任何情况(包括is null =一个值),以上两种情况索引都会走。其他情况不会走。

 

 

 

    

 

    

 

原文地址:https://www.cnblogs.com/gis-sky/p/9626796.html