Mysql流程解析

流程图

2018032413170578

流程图解析

客户端发送一条sql语句。

1、此时，mysql会检查sql语句，查看是否命中缓存，如果命中缓存，直接返回结果，不继续执行。没有命中则进入解析器。

2、解析器会检查sql语句的语法，并生成一个解析树。

3、预处理器会检查解析树的表名，列名等是否正确，表是否有权限等。

4、当解析树是一个合法的了，优化器将其转化成执行计划，一个解析树有多个执行计划，但是都返回同样的结果，唯一不同的是，每个执行计划的成本不一样，mysql会选择一个最低成本的执行计划来执行。

5、查询执行引擎解析执行计划，通过调用相应的存储引擎的接口来完成，最终返回sql的结果，如果缓存开启，那么将结果也存储到查询缓存中。

1、查询缓存

①解析器解析sql语句之前，会先查看这条sql语句是否命中缓存的数据，如果缓存中有数据，则会检查权限之后返回数据。

②mysql将缓存存在一个表中，通过一个哈希算法的索引来检查是否命中缓存。这个哈希算法包括查询的sql语句本身、要查询的数据库，客户端协议版本号等一系列可能影响查询结果的信息计算出来的，所以如果sql语句有一个字符不相同，都不会命中缓存。

③如果查询中含有自定义函数，存储过程，变量，临时表等，不会进行缓存，因为这些属于变量，在上面提到，如果不相同不会命中缓存。比如now()，current_date()等函数。

④如果表的结构或数据发生变化，那么这张表的所有缓存都会失效。因为缓存的数据在表中会被修改，会导致缓存和表不一致。所以在进行写操作时，写入后，对应的表的缓存都会失效。

⑤如果缓存太大或者缓存碎片太多，会导致系统性能下降，并且参考第④点，所以mysql默认不开启缓存。

mysql> show variables like "%query_cache%";
+------------------------------+---------+
| Variable_name                | Value   |
+------------------------------+---------+
| have_query_cache             | YES     |
| query_cache_limit            | 1048576 |
| query_cache_min_res_unit     | 4096    |
| query_cache_size             | 0       |
| query_cache_type             | OFF     |
| query_cache_wlock_invalidate | OFF     |
+------------------------------+---------+
6 rows in set

2、解析器

解析器会将一条sql语句解析成一个解析树。

比如

select username from ADMIN;

先通过词义解析，会将这条sql语句解析成

关键字	非关键字	关键字	非关键字
select	username	from	ADMIN

然后通过语义解析

2019-12-01_143646

3、预处理器

通过预处理器，会判断解析树的表名，字段名或表的权限是否符合要求。

4、查询优化器

通过预处理器后，解析树便是合法的了。于是查询优化器将解析树转换成执行计划，一个解析树可以转换成多个执行计划，但是它们的最终结果都是一样的。mysql的查询优化器会计算每个执行计划的成本，最终选择最低成本的执行计划来执行。

最低成本通常认为是时间最短，但是mysql不这么认为，它是选择成本小的，成本小≠时间短。

mysql的一些优化策略

①重新定义表的关联顺序。

进行多表关联操作时，mysql不一定按照sql语句中的表的顺序执行，它使用了一些技巧来关联。

②优化min()和max()函数。

查找某列的最大或最小值时，如果该列有索引，只需要查找最左端或最右端。

③提前终止查询。

使用limit时，如果查找到了满足数量的结果，就终止查询。

④优化排序。

老版本中会进行两次传输排序（先读取行指针和排序字段在内存中进行排序，然后根据排序的结果去寻找数据），新版本中只需单次传输排序（先一次性把所有数据读取，再进行排序）。

5、查询执行引擎

查询执行引擎会解析执行计划，然后调用相应的存储引擎的接口来完成sql语句里的操作。

6、返回结果

将结果返回给客户端，即便里面没有行数据，也会返回一些信息，比如执行时间，影响行数。如果开启了缓存，同时也会将结果存入缓存中。

返回客户端是一个增量并逐步返回的过程，有可能在mysql查询到了第一条结果时就开始返回。这样做的好处是能够让客户端第一时间接收到sql语句执行的结果，同时服务端不用存储太多结果而占用过大的内存空间。