mysql查询性能优化（持续更新）

查询大数据表的优化：

操作： 查询条件放到子查询中，子查询只查主键ID，然后使用子查询中确定的主键关联查询其他的属性字段；

原理： 减少回表操作；

-- 优化前SQL，要17S
SELECT  各种字段
FROM`table_name`
WHERE 各种条件
LIMIT0,10;

-- 优化后SQL,要300ms
SELECT  各种字段
FROM`table_name` main_tale
RIGHTJOIN
(
SELECT  子查询只查主键
FROM`table_name`
WHERE 各种条件
LIMIT0,10;
) temp_table ON temp_table.主键 = main_table.主键

原因总结：

查询到索引叶子节点数据。根据叶子节点上的主键值去聚簇索引上查询需要的全部字段值。

参考资料：

1.https://explainextended.com/2009/10/23/mysql-order-by-limit-performance-late-row-lookups/

2.https://dev.mysql.com/doc/refman/5.7/en/innodb-information-schema-buffer-pool-tables.html

一、一些常见的SQL实践

（1）负向条件查询不能使用索引。

　　select * from order where status!=0 and stauts!=1not in/not exists都不是好习惯。
　　可以优化为in查询：select * from order where status in(2,3)

（2）前导模糊查询不能使用索引。

　　select * from order where desc like '%XX'而

　　非前导模糊查询则可以：

　　select * from order where desc like 'XX%'

　(3）数据区分度不大的字段不宜使用索引。

　　select * from user where sex=1

　　原因：性别只有男，女，每次过滤掉的数据很少，不宜使用索引。
　　经验上，能过滤80%数据时就可以使用索引。

　　对于订单状态，如果状态值很少，不宜使用索引，如果状态值很多，能够过滤大量数据，则应该建立索引。

（4）在属性上进行计算不能命中索引。

　　select * from order where YEAR(date) < = '2020'

　　即使date上建立了索引，也会全表扫描，可优化为值计算：

　　select * from order where date < = CURDATE()

　　或者：

　　select * from order where date < = '2020-01-01'

二、并非周知的SQL实践

（5）如果业务大部分是单条查询，使用Hash索引性能更好，例如用户中心。

　　select * from user where uid=?

　　select * from user where login_name=?

　　原因：

　　B-Tree索引的时间复杂度是O(log(n))；

　　Hash索引的时间复杂度是O(1)。

（6）允许为null的列，查询有潜在大坑。

　　单列索引不存null值，复合索引不存全为null的值，如果列允许为null，可能会得到“不符合预期”的结果集。

　　select * from user where name != 'shenjian'如

　　果name允许为null，索引不存储null值，结果集中不会包含这些记录。
　　所以，请使用not null约束以及默认值。

（7）复合索引最左前缀，并不是指SQL语句的where顺序要和复合索引一致。

　　用户中心建立了(login_name, passwd)的复合索引

　　select * from user where login_name=? and passwd=?

　　select * from user where passwd=? and login_name=?

　　都能够命中索引。

　　select * from user where login_name=?

　　也能命中索引，满足复合索引最左前缀。

　　select * from user where passwd=?

　　不能命中索引，不满足复合索引最左前缀。

（8）使用ENUM而不是字符串。

　　ENUM保存的是TINYINT，别在枚举中搞一些“中国”“北京”“技术部”这样的字符串，字符串空间又大，效率又低。

三、小众但有用的SQL实践

（9）如果明确知道只有一条结果返回，limit 1能够提高效率。

　　select * from user where login_name=?

　　可以优化为：select * from user where login_name=? limit 1

　　原因：

　　你知道只有一条结果，但数据库并不知道，明确告诉它，让它主动停止游标移动。

（10）把计算放到业务层而不是数据库层，除了节省数据的CPU，还有意想不到的查询缓存优化效果。

　　select * from order where date < = CURDATE()

　　这不是一个好的SQL实践，应该优化为：

　　$curDate = date('Y-m-d');

　　$res = mysql_query( 'select * from order where date < = $curDate');

　　画外音：不要问我这是什么语言。

　　原因：释放了数据库的CPU。多次调用，传入的SQL相同，才可以利用查询缓存。

（11）强制类型转换会全表扫描

　　select * from user where phone=13800001234

　　你以为会命中phone索引么？大错特错了！！！

　　末了，再加一条，不要使用select *（潜台词，文章的SQL都不合格 =_=），只返回需要的列，能够大大的节省数据传输量，与数据库的内存使用量哟。