mysql查询优化~group by和order by

一简介:聊聊group by的分组
二 explain体现
extra下
1 using tempoary
2 using tempoary && using filesort
3 using filesort
4 none
三实现方式
1 定义
GROUP BY 实际上也同样会进行排序操作，而且与ORDER BY 相比，GROUP BY 主要只是多了排序之后的分组操作,所以group by同样可以利用到索引
2 实现方式
使用松散（Loose）索引扫描实现 GROUP BY
1 单一表查询
2 Group by中只有最左前缀列，没有其他列
3 只支持max和min聚合，而且，要聚合的列必须是group by中列所在的索引(未测试)
4 未被group by引用的索引其他部分必须是常量（不理解）
5 不支持前缀索引。
eg
-- 因为聚合函数不是max或者min
SELECT c1, SUM(c2) FROM t1 GROUP BY c1;
-- 因为不符合最左前缀原则
SELECT c1, c2 FROM t1 GROUP BY c2, c3;
-- 查询涉及到了索引的一部分，紧跟group by中的列，但是没有常量等值语句，加上 WHERE c3 = const就好了
SELECT c1, c3 FROM t1 GROUP BY c1, c2;
2 使用临时表实现 GROUP BY
处理过程通过where索引过滤然后放置在临时表中再进行分组+排序
四优化
1 尽量使用group by 的分组利用到联合索引
2 尽量添加order by null避免filesort
五 order by 使用场景解析

select * from table order by a1 当a1有索引的时候是可以利用到索引的

select * from table where a1=1 order by b1 当a 和 b为联合索引且a为最左的时候是可以利用到索引的

select * from table order by a1 desc, b1 利用8.0的特性创建制定顺序的联合索引是可以的,其他情况下是不能利用到索引,因为联合索引只能按照一个顺序进行查找

select * from table order by a1,b1 当a和b为联合索引时是可以利用到索引的

select * from table where a1 > n order by a1 这种情况下根据数据量的分布可能会利用到icp特性或者应用不到索引

select * from table where a1 = n and b1 > n order by b1 这种情况下可能会遇到ICP特性

select * from table group a1 order by b1 这种情况下不能利用索引

相关排序参数 sort_buffer_size 先利用这个参数内存,只有内存不够了才会在磁盘形成临时文件

六 order by 与分页操作

select * from table where a = b = order by id limit 10

现象通过explain 走的是ID主键奇怪现象 asc 与 desc 相差速度很大,但是explain确是相同

分析通过explain分析可知,执行顺序为先根据order by进行排序然后再进行条件过滤最后分页取操作. asc与desc执行速度的不同其实也可以推测. 那么就是结果集的数据都集中在正向而不是反向.那么这样desc 和asc的速度不一样就可以得知了.而limit 小结果集的加入让sql优化器更倾向于order by 索引

解决方法: 1 order by 的排序项最好能参与到 where条件过滤中,即是联合索引的一部分 2 调大 limit 结果集(根据业务决定) 3 采用延迟join