SQL优化

 一、优化SQL语句的一般步骤

1. 通过show status命令了解各种SQL的执行频率

mysqladmin extended-status

或:

show [session|global]status

参数解析:

session表示当前连接的统计结果,global表示自数据库上次启动至今的统计结果。默认为session

例如,查看当前session中所有统计参数的值:

show status like 'Com_%';

  Com_xxx表示每个xxx语句执行的次数,比如,Com_select表示执行select操作的次数。通过这些参数可以了解当前数据库的应用是以插入更新为主还是以查询操作为主。对于事务型的应用,通过Com_commitCom_rollback可以了解事务提交和回滚的情况。

  此外,以下几个参数便于用户了解数据库的基本情况。

Connections:试图连接MySQL服务器的次数。

Uptime:服务器工作时间。

Slow_queries:慢查询的次数。

2. 定位执行效率较低的SQL语句

1)通过慢查询日志定位那些执行效率较低的SQL 语句,用--log-slow-queries[=file_name]选项启动时,mysqld 写一个包含所有执行时间超过long_query_time 秒的SQL 语句的日志文件。

2)慢查询日志在查询结束以后才记录,所以在应用反映执行效率出现问题的时候查询慢查询日志并不能定位问题,可以使用show processlist 命令查看当前MySQL 在进行的线程,包括线程的状态、是否锁表等,可以实时地查看SQL 的执行情况,同时对一些锁表操作进行优化。

3. 通过explain分析低效SQL的执行计划

  使用explain分析SQL可以看到SQL执行过程中是否使用索引、扫描行数量等情况。

4. 确定问题并采取相应的优化措施

  确定问题所在之后就可以根据实际情况采取相应的措施,优化提高SQL执行的效率。比如,若是发现查询SQL执行时进行了全表扫描导致了效率低下,则可以考虑在适当的字段创建索引。

 

二、两个简单使用的优化方法

1. 定期分析表和检查表:

1)分析表语法:

ANALYZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] ...

2)检查表语法:

CHECK TABLE tbl_name [, tbl_name] ... [option] ... option = {QUICK | FAST | MEDIUM | EXTENDED | CHANGED}

  CHECK TABLE 也可以检查视图是否有错误,比如在视图定义中被引用的表是否已不存在。

2. 定期优化表:

优化表语法:

OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_name [, tbl_name] ...

  如果已经删除了表的一大部分,或者如果已经对含有可变长度行的表(含有VARCHARBLOB TEXT 列的表)进行了很多更改,则应使用OPTIMIZE TABLE 命令来进行表优化。这个命令可以将表中的空间碎片进行合并,并且可以消除由于删除或者更新造成的空间浪费,但OPTIMIZE TABLE命令只对MyISAMBDBInnoDB表起作用。

注意:

  ANALYZECHECKOPTIMIZE 执行期间将对表进行锁定,因此一定注意要在数据库不繁忙的时候执行相关的操作。

 

三、常用SQL的优化

1. 大批量插入数据

  对于MyISAM 存储引擎的表,可以通过以下方式快速的导入大量的数据。

ALTER TABLE tbl_name DISABLE KEYS;

loading the data

ALTER TABLE tbl_name ENABLE KEYS;

  DISABLE KEYSENABLE KEYS用来打开或者关闭MyISAM表非唯一索引的更新。在导入大量的数据到一个非空的MyISAM表时,通过设置这两个命令,可以提高导入的效率。对于导入大量数据到一个空的MyISAM表,默认就是先导入数据然后才创建索引的,所以不用进行设置。

  对于InnoDB类型的表,这种方式并不能提高导入数据的效率,但有以下几种方式可以提高InnoDB表的导入效率。

(1)因为InnoDB 类型的表是按照主键的顺序保存的,所以将数据按照主键的顺序排列导入,可以有效地提高数据导入的效率。

(2)在导入数据前执行SET UNIQUE_CHECKS=0,关闭唯一性校验,在导入结束后执行SET UNIQUE_CHECKS=1,恢复唯一性校验,可以提高导入的效率。

(3)如果应用使用自动提交的方式,建议在导入前执行SET AUTOCOMMIT=0关闭自动提交,导入结束后再执行SET AUTOCOMMIT=1,打开自动提交,也可以提高导入的效率。

大批量插入数据示例:

load data infile '/home/mysql/film_test.txt' into table film_test2;

2. Insert语句优化

(1)如果同时从同一客户端插入很多行,尽量使用多个值表的INSERT 语句,这种方式将大大缩减客户端与数据库之间的连接、关闭等消耗,使得效率比分开执行的单个INSERT 语句快(在一些情况中快几倍)

多值表insert语句示例:insert into test values(1,2),(1,3),(1,4)

(2)如果从不同客户端插入很多行,能通过使用INSERT DELAYED 语句得到更高的速度。DELAYED 的含义是让INSERT 语句马上执行,其实数据都被放在内存的队列中,并没有真正写入磁盘,这比每条语句分别插入要快的多。

3)将索引文件和数据文件分在不同的磁盘上存放(利用建表中的选项)。

4)如果进行批量插入,可以增加bulk_insert_buffer_size 变量值的方法来提高速度,但是,这只能对MyISAM表使用。

(5)当从一个文本文件装载一个表时,使用LOAD DATA INFILE。这通常比使用很INSERT语句快20倍。

3. Group by语句优化

  默认情况下,MySQL对所有GROUP BY col1col2....的字段进行排序。这与在查询中指定ORDER BY col1col2...类似。因此,如果显式包括一个包含相同的列的ORDER BY 子句,则对MySQL 的实际执行性能没有什么影响。如果查询包括GROUP BY 但用户想要避免排序结果的消耗,则可以指定ORDER BY NULL禁止排序。

4. Order by语句优化

  在某些情况中,MySQL可以使用一个索引来满足ORDER BY子句,而不需要额外的排序。WHERE 条件和ORDER BY 使用相同的索引,并且ORDER BY 的顺序和索引顺序相同,并且ORDER BY的字段都是升序或者都是降序,这些情况下可以使用索引。

5. 嵌套查询优化

  使用子查询可以一次性地完成很多逻辑上需要多个步骤才能完成的SQL 操作,同时也可以避免事务或者表锁死,并且写起来也很容易。但是,有些情况下,子查询可以被更有效率的连接(JOIN)替代。连接之所以更有效率一些,是因为MySQL 不需要在内存中创建临时表来完成逻辑上需要多个步骤的查询工作。

6. Or条件优化

  对于含有OR 的查询子句,如果要利用索引,则OR之间的每个条件列都必须用到索引;如果没有索引,则应该考虑增加索引。OR之间的任何一个条件没有索引的话所有涉及的索引都不会被使用,复合索引的列做OR操作的话也不会使用索引。MySQL 在处理含有OR子句的查询时,实际是对OR 的各个子句分别查询后的结果进行了UNION

7. 使用SQL提示

  用户可以使用use indexignore indexforce indexSQL提示来进行选择SQL的执行计划。

 

原文地址:https://www.cnblogs.com/wujuntian/p/5936578.html