Mysql查询优化

Mysql的优化,一般是对索引优化,这里主要以innodb为主

索引是帮助MySQL高效获取数据的排好序的数据结构,排好序是索引数据结构的特点,也是索引优化的前提。

1. 索引数据结构

索引底层使用B+树作为其底层存储结构。相较于二叉树、红黑树、hash表、B树而言,B+树有自己独特的优势。

B+树特点

  • 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能

1.1 聚集索引(主键索引)

聚集索引指索引包含了完整的数据记录,一般主键索引是聚集索引

mysql使用B+树存储索引,页大小默认为16K,mysql在查询时会一次性将一个页加载到内存中(一次磁盘I/O),在内存中可以快速定位下一次需要加载的页(有一次磁盘I/O),所以一般精准查询只需要进行三次磁盘I/O即可找到对应的数据。

1.2联合索引

也称非聚集索引,非聚集索引的data存储的是聚集索引的值,如果返回的数据包含了非索引值,那么就需要通过聚集索引找到完整的记录,这里就会产生回表,一般建议使用覆盖索引,也就是查询返回值都在索引列中,例如下图,只返回name,age,position值的话,就不需要再去聚集索引查找其他数据,速度会快很多。

2. 优化建议

  • 建表时尽量建主键(不建主键,mysql内部也会自己创建一个主键)
  • 主键尽量使用整型的自增主键(自增主键会减少插入)
  • 索引最佳实践
    • 全值匹配
    • 最左前缀法则
    • 不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
    • 存储引擎不能使用索引中范围条件右边的列
    • 尽量使用覆盖索引(只访问索引的查询(索引列包含查询列)),减少 select * 语句
    • mysql在使用不等于(!=或者<>),not in,not exists的时候无法使用索引会导致全表扫描<小于、>大于、<=、>=这些,mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引
    • is null,is not null 一般情况下也无法使用索引
    • like以通配符开头(%abc)mysql索引失效会变成全表扫描操作
    • 字符串不加单引号索引失效
    • 少用or或in,用它查询时,mysql不一定使用索引,mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引

3. Explain

  • 模拟优化器执行SQL语句,分析你的查询语句或是结构的性能瓶颈
  • 如果 from 中包含子查询,仍会执行该子查询,将结果放入临时表中

3.1 . id列

id列的编号是 select 的序列号,有几个 select 就有几个id,并且id的顺序是按 select 出现的顺序增长的。

id列越大执行优先级越高,id相同则从上往下执行,id为NULL最后执行

3.2 select_type列

select_type 表示对应行是简单还是复杂的查询

  • simple:简单查询。查询不包含子查询和union
  • primary:复杂查询中最外层的 select
  • subquery:包含在 select 中的子查询(不在 from 子句中)
  • derived:包含在 from 子句中的子查询。MySQL会将结果存放在一个临时表中,也称为派生表
  • union:在 union 中的第二个和随后的 select

3.3 table列

这一列表示 explain 的一行正在访问哪个表。

当 from 子句中有子查询时,table列是 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查 询。

当有 union 时,UNION RESULT 的 table 列的值为<union1,2>,1和2表示参与 union 的 select 行id

3.4 type列

关联类型或访问类型,即MySQL决定如何查找表中的行

依次从最优到最差分别为:system > const > eq_ref > ref > range > index > ALL 一般来说,得保证查询达到range级别,最好达到ref

NULL:mysql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引。例如:在索引列中选取最小值,可 以单独查找索引来完成,不需要在执行时访问表

3.5 possible_keys列

查询可能使用哪些索引来查找

出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引 对此查询帮助不大,选择了全表查询

3.6 key列

这一列显示mysql实际采用哪个索引来优化对该表的访问。如果没有使用索引,则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 force index、ignore index。

3.7 key_len列

显示mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列

key_len计算规则如下:

  • 字符串,char(n)和varchar(n),n为字符数
    • char(n):一个数字或字母占1个字节,一个汉字占3个字节,存汉子就是3n字节
    • 如果存汉字则长度是 3n + 2 字节,加的2字节用来存储字符串长度,因为 varchar是变长字符串
  • 数值类型:
    • tinyint:1字节
    • smallint:2字节
    • int:4字节
    • bigint:8字节
  • 时间类型
    • date:3字节
    • timestamp:4字节
    • datetime:8字节
  • 如果字段允许为 NULL,需要1字节记录是否为 NULL
  • 索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索 引。

3.8 ref列

这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),字段名

3. 9rows列

是mysql估计要读取并检测的行数,注意这个不是结果集里的行数

3.10 Extra列

这一列展示的是额外信息

原文地址:https://www.cnblogs.com/steven158/p/15504824.html