Mysql查询优化

Mysql的优化，一般是对索引优化,这里主要以innodb为主

索引是帮助MySQL高效获取数据的排好序的数据结构,排好序是索引数据结构的特点，也是索引优化的前提。

1. 索引数据结构

索引底层使用B+树作为其底层存储结构。相较于二叉树、红黑树、hash表、B树而言，B+树有自己独特的优势。

B+树特点

非叶子节点不存储data，只存储索引(冗余)，可以放更多的索引
叶子节点包含所有索引字段
叶子节点用指针连接，提高区间访问的性能

1.1 聚集索引（主键索引）

聚集索引指索引包含了完整的数据记录,一般主键索引是聚集索引

mysql使用B+树存储索引，页大小默认为16K,mysql在查询时会一次性将一个页加载到内存中（一次磁盘I/O）,在内存中可以快速定位下一次需要加载的页（有一次磁盘I/O），所以一般精准查询只需要进行三次磁盘I/O即可找到对应的数据。

1.2联合索引

也称非聚集索引，非聚集索引的data存储的是聚集索引的值，如果返回的数据包含了非索引值，那么就需要通过聚集索引找到完整的记录，这里就会产生回表，一般建议使用覆盖索引，也就是查询返回值都在索引列中，例如下图，只返回name，age，position值的话，就不需要再去聚集索引查找其他数据，速度会快很多。

2. 优化建议

建表时尽量建主键（不建主键，mysql内部也会自己创建一个主键）
主键尽量使用整型的自增主键（自增主键会减少插入）
索引最佳实践
- 全值匹配
- 最左前缀法则
- 不在索引列上做任何操作（计算、函数、（自动or手动）类型转换），会导致索引失效而转向全表扫描
- 存储引擎不能使用索引中范围条件右边的列
- 尽量使用覆盖索引（只访问索引的查询（索引列包含查询列）），减少 select * 语句
- mysql在使用不等于（！=或者<>），not in，not exists的时候无法使用索引会导致全表扫描<小于、>大于、<=、>=这些，mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引
- is null,is not null 一般情况下也无法使用索引
- like以通配符开头（%abc）mysql索引失效会变成全表扫描操作
- 字符串不加单引号索引失效
- 少用or或in，用它查询时，mysql不一定使用索引，mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引

3. Explain

模拟优化器执行SQL语句，分析你的查询语句或是结构的性能瓶颈
如果 from 中包含子查询，仍会执行该子查询，将结果放入临时表中

3.1 . id列

id列的编号是 select 的序列号，有几个 select 就有几个id，并且id的顺序是按 select 出现的顺序增长的。

id列越大执行优先级越高，id相同则从上往下执行，id为NULL最后执行

3.2 select_type列

select_type 表示对应行是简单还是复杂的查询

simple：简单查询。查询不包含子查询和union
primary：复杂查询中最外层的 select
subquery：包含在 select 中的子查询（不在 from 子句中）
derived：包含在 from 子句中的子查询。MySQL会将结果存放在一个临时表中，也称为派生表
union：在 union 中的第二个和随后的 select

3.3 table列

这一列表示 explain 的一行正在访问哪个表。

当 from 子句中有子查询时，table列是格式，表示当前查询依赖 id=N 的查询，于是先执行 id=N 的查询。

当有 union 时，UNION RESULT 的 table 列的值为<union1,2>，1和2表示参与 union 的 select 行id

3.4 type列

关联类型或访问类型，即MySQL决定如何查找表中的行

依次从最优到最差分别为：system > const > eq_ref > ref > range > index > ALL 一般来说，得保证查询达到range级别，最好达到ref

NULL：mysql能够在优化阶段分解查询语句，在执行阶段用不着再访问表或索引。例如：在索引列中选取最小值，可以单独查找索引来完成，不需要在执行时访问表

3.5 possible_keys列

查询可能使用哪些索引来查找

出现 possible_keys 有列，而 key 显示 NULL 的情况，这种情况是因为表中数据不多，mysql认为索引对此查询帮助不大，选择了全表查询

3.6 key列

这一列显示mysql实际采用哪个索引来优化对该表的访问。如果没有使用索引，则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引，在查询中使用 force index、ignore index。

3.7 key_len列

显示mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列

key_len计算规则如下：

字符串，char(n)和varchar(n),n为字符数
- char(n)：一个数字或字母占1个字节，一个汉字占3个字节，存汉子就是3n字节
- 如果存汉字则长度是 3n + 2 字节，加的2字节用来存储字符串长度，因为 varchar是变长字符串
数值类型：
- tinyint：1字节
- smallint：2字节
- int：4字节
- bigint：8字节
时间类型
- date：3字节
- timestamp：4字节
- datetime：8字节
如果字段允许为 NULL，需要1字节记录是否为 NULL
索引最大长度是768字节，当字符串过长时，mysql会做一个类似左前缀索引的处理，将前半部分的字符提取出来做索引。

3.8 ref列

这一列显示了在key列记录的索引中，表查找值所用到的列或常量，常见的有：const（常量），字段名

3. 9rows列

是mysql估计要读取并检测的行数，注意这个不是结果集里的行数

3.10 Extra列

这一列展示的是额外信息