mysql高级(索引优化分析)

1、MySQL Query Optimizer
2、mysql常见瓶颈
3、explain使用简介
4、explain之id
5、explain之select_type和table
6、explain之type
7、explain之possible_keys、key和key_len
8、explain之ref
9、explain之rows
10、explain之Extra及覆盖索引

1、MySQL Query Optimizer <--返回目录

　　mysql中有专门负责优化select语句的优化器模块，主要功能：通过计算分析系统中收集到的统计信息，为客户端请求的query提供它认为最优的执行计划（它认为的最优的数据检索方式，但不见得是DBA认为是最优的）。

　　当客户端向mysql请求一条query，命令解析器模块完成请求分类，区别出是select并转发给MySQL Query Optimizer时，MySQL Query Optimizer首先会对整条query进行优化，处理掉一些常量表达式的预算，直接换算成常量值。并对query中的查询条件进行简化和转换，如去掉一些无用或显而易见的条件、结构调整等。然后分析query中的Hini信息（如果有），看显示Hint信息是否可以完全确定该query的执行计划。如果没有Hint或Hint信息还不足以完全确定执行计划，则会读取所涉及对象的统计信息，根据query进行写相应的计算分析，然后再得出最后的执行计划。

2、mysql常见瓶颈 <--返回目录

　　1）CPU：CPU再饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候

　　2）IO：磁盘IO瓶颈发生在装入数据远大于内存容量的时候

　　服务器硬件的性能瓶颈：top, free, iostat, vmstat来查看系统的性能状态

3、explain使用简介 <--返回目录

　　explain查看执行计划：使用explain关键字可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理SQL查询语句的。分析你的查询语句或是表结构的性能瓶颈。

　　explain + SQL语句==>执行计划包含的信息：

　　explain结果（执行计划）包含的信息：

　　1）表的读取顺序 id

　　2）数据读取操作的操作类型 select_type

　　3）哪些索引可以使用 possible_keys

　　4）哪些索引被实际引用 key

　　5）表之间的引用 ref

　　6）每张表有多少行被优化器查询 rows

4、explain之id <--返回目录

　　id: select 查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序。

　　id 相同，执行顺序由上到下。

　　如果是子查询，id的序号会递增，id越大优先级越高（越先被执行）。

　　比如：

　　id
　　1
　　1    ==> id相同（可以认为是一组），从上往下顺序执行
　　2    ==> id值越大，优先执行

5、explain之select_type和table <--返回目录

　　table: 显示这一行的数据是关于哪张表的。

　　select_type有哪些值：simple（普通查询）、primary（若包含子查询，最外层查询标记为primary）、subquery（子查询）、derived（衍生）、union、union result

　　1) simple: 简单的 select 查询，查询中不包含子查询或者union

　　2）primary: 查询中若包含复杂的子部分，最外层查询则被标记为primary

　　3）subquery: 在select或where列表中包含子查询

　　4）derived: 在from列表中包含的子查询被标记为derived（衍生），MySQL会递归执行这些子查询，把结果放到临时表里。

　　5）union：若第二个select出现在union之后，则被标记为union；若union包含在from子句的子查询中，外层select将被标记为derived

　　6) union result: 从union表获取结果的select

6、explain之type <--返回目录

　　type: 访问类型（显示查询使用了何种类型） all、index、range、ref、eq_ref、const、system、NULL

　　最好 system > const > eq_ref > ref > range > index > all 最差

　　一般来说（百万记录以上），得保证查询至少达到range级别，最好达到ref级别。

system: 表只有一行记录（等于系统表），这是const类型的特例，平时不会出现，这个可以忽略不记

const: 表示通过索引一次就找到了，const用于比较primary key或者unique索引。因为只匹配一行数据，所以很快。如将主键置于where列表中，MySQL能将该查询转换为一个常量。

eq_ref: 唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于主键或唯一键索引扫描。

ref: 非唯一键索引扫描，返回匹配某个单独值的所有行。本质上也是一种索引访问，它返回所有匹配某个单独值的行，然而，它可能会找到多个符合条件的行，所以它应该属于查找和扫描的混合体。

range: 只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引。一般是当where语句中出现 between、> 、< 、 in 等的查询。这种范围索引扫描比全表扫描要好，因为它只需要开始于索引的某一点，而结束于另一点，不用扫描全部索引。

index: funll index scan。

all: full table scan 扫描全表。

7、explain之possible_keys、key和key_len <--返回目录

　　possibel_keys: 可能应用于这张表中的索引。查询涉及到的字段上若存在索引，则该索引被列表，但不一定被实际使用。

　　key：实际使用的索引，如果为null，则没有使用索引。查询中若使用了覆盖索引，则该索引仅出现在key列表中。

　　key_len:表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下，长度越短越好。key_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得，不是通过表内检索出的。

8、explain之ref <--返回目录

　　ref: 显示索引哪一列被使用了，如果可能的话，是一个常数。哪些列或常量被用于查找索引列上的值。

　　example1: table t3的ref 为 test.t1.id，test为库名，因为where查询条件 t3.id=t1.id，所以ref 为test.t1.id;

　　　　　　 table t1的查询条件 t1.other_column = “” 为等于一个常数，所以 ref 为 const

　　example2: table t1 的查询条件t1.col1=t2.col1，t1.other_column=""，所以ref =库名.t2.col1,const

9、explain之rows <--返回目录

　　rows: 根据表统计信息及索引选用情况，大致估算出找到所需的记录所需要读取的行数。

10、explain之Extra及覆盖索引 <--返回目录

　　Extra: 包含不适合在其他列中显示但十分重要的额外信息。

　　1）Using filesort:（严重）说明 mysql 会对数据使用一个外部的索引排序，而不是按照表内的所有顺序进行读取。mysql 中无法利用索引完成的排序操作称为"文件排序"。

　　2）Using temporary: （严重）使用了临时表保存中间结果，mysql 在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。

　　3）Using index:（性能好）表示相应的 select 操作中使用了覆盖索引（Covering Index），避免了访问表的数据行，效率不错！如果同时出现Using where，表明索引被用来执行索引键值的查找；如果没有同时出现Using where，表明索引用来读取数据而非执行查找动作。

　　覆盖索引（Covering Index）,一说索引覆盖。

　　理解1：就是 select 的数据列只从索引中就能够取得，不必读取数据行，mysql 可以利用索引返回 select 列表中的字段，而不必根据索引再次读取数据文件，换句话说查询列要被所建的所有覆盖。

　　理解2：索引是高效找到行的一个方法，但是一般数据库也能使用索引找到一个列的数据，因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据；当能通过索引就可以得到想要的数据，那就不需要读取行了。一个索引包含了（覆盖了）满足查询结果的数据就叫做覆盖索引。

　　注意：如果要使用覆盖索引，一定要注意 select 列表中只取出需要的列，不可 select *，因为如果将所有字段一起做索引会导致索引文件过大，查询性能下降。

　　4）Using where: 表明使用了where过滤

　　5）Using join buffer: 使用了连接缓存

　　6）impossible where: where 子句的值总是false，不能用来获取任何元组

　　7）select tables optimized away: 在没有group by子句的情况下，基于索引优化min/max操作或者对应MyISAM存储引擎优化count(*)操作，不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化。

　　8）distinct: 优化distinct操作，在找到第一匹配的元组后即停止找同样值的动作。

---