Mysql流程解析

Mysql流程解析

流程图

2018032413170578

流程图解析

客户端发送一条sql语句。

1、此时,mysql会检查sql语句,查看是否命中缓存,如果命中缓存,直接返回结果,不继续执行。没有命中则进入解析器。

2、解析器会检查sql语句的语法,并生成一个解析树。

3、预处理器会检查解析树的表名,列名等是否正确,表是否有权限等。

4、当解析树是一个合法的了,优化器将其转化成执行计划,一个解析树有多个执行计划,但是都返回同样的结果,唯一不同的是,每个执行计划的成本不一样,mysql会选择一个最低成本的执行计划来执行。

5、查询执行引擎解析执行计划,通过调用相应的存储引擎的接口来完成,最终返回sql的结果,如果缓存开启,那么将结果也存储到查询缓存中。

1、查询缓存

①解析器解析sql语句之前,会先查看这条sql语句是否命中缓存的数据,如果缓存中有数据,则会检查权限之后返回数据。

②mysql将缓存存在一个表中,通过一个哈希算法的索引来检查是否命中缓存。这个哈希算法包括查询的sql语句本身、要查询的数据库,客户端协议版本号等一系列可能影响查询结果的信息计算出来的,所以如果sql语句有一个字符不相同,都不会命中缓存

③如果查询中含有自定义函数,存储过程,变量,临时表等,不会进行缓存,因为这些属于变量,在上面提到,如果不相同不会命中缓存。比如now(),current_date()等函数。

④如果表的结构或数据发生变化,那么这张表的所有缓存都会失效。因为缓存的数据在表中会被修改,会导致缓存和表不一致。所以在进行写操作时,写入后,对应的表的缓存都会失效。

⑤如果缓存太大或者缓存碎片太多,会导致系统性能下降,并且参考第④点,所以mysql默认不开启缓存。

mysql> show variables like "%query_cache%";
+------------------------------+---------+
| Variable_name                | Value   |
+------------------------------+---------+
| have_query_cache             | YES     |
| query_cache_limit            | 1048576 |
| query_cache_min_res_unit     | 4096    |
| query_cache_size             | 0       |
| query_cache_type             | OFF     |
| query_cache_wlock_invalidate | OFF     |
+------------------------------+---------+
6 rows in set

2、解析器

解析器会将一条sql语句解析成一个解析树。

比如

select username from ADMIN;

先通过词义解析,会将这条sql语句解析成

关键字 非关键字 关键字 非关键字
select username from ADMIN

然后通过语义解析

2019-12-01_143646

3、预处理器

通过预处理器,会判断解析树的表名,字段名或表的权限是否符合要求。

4、查询优化器

通过预处理器后,解析树便是合法的了。于是查询优化器将解析树转换成执行计划,一个解析树可以转换成多个执行计划,但是它们的最终结果都是一样的。mysql的查询优化器会计算每个执行计划的成本,最终选择最低成本的执行计划来执行。

最低成本通常认为是时间最短,但是mysql不这么认为,它是选择成本小的,成本小≠时间短。

mysql的一些优化策略

①重新定义表的关联顺序。

​ 进行多表关联操作时,mysql不一定按照sql语句中的表的顺序执行,它使用了一些技巧来关联。

②优化min()和max()函数。

​ 查找某列的最大或最小值时,如果该列有索引,只需要查找最左端或最右端。

③提前终止查询。

​ 使用limit时,如果查找到了满足数量的结果,就终止查询。

④优化排序。

​ 老版本中会进行两次传输排序(先读取行指针和排序字段在内存中进行排序,然后根据排序的结果去寻找数据),新版本中只需单次传输排序(先一次性把所有数据读取,再进行排序)。

5、查询执行引擎

查询执行引擎会解析执行计划,然后调用相应的存储引擎的接口来完成sql语句里的操作。

6、返回结果

将结果返回给客户端,即便里面没有行数据,也会返回一些信息,比如执行时间,影响行数。如果开启了缓存,同时也会将结果存入缓存中。

返回客户端是一个增量并逐步返回的过程,有可能在mysql查询到了第一条结果时就开始返回。这样做的好处是能够让客户端第一时间接收到sql语句执行的结果,同时服务端不用存储太多结果而占用过大的内存空间。

原文地址:https://www.cnblogs.com/lxxxxxxy/p/11966207.html