如何编写高效的SQL

编写高效的sql可以给用户带来好的体验,需要开发这没有意识到这一点因为他们不关心也不知道怎么做。高效的sql可以给用户节省很多时间,这样就不需要dba来找上门,也不需要搭建RCA和性能调优。


性能不好的SQL有需要原因,其中之一是:全表扫描

  1. 什么时候应该用全表扫描

    并不是说用全表扫描的方法来从表中获取数据是糟糕的方式,优化器选择全表扫描的方式而不选择索引的方式基于以下几点:

    a)如果数据量特别大,使用索引的方式不一定会比全表扫描快;

    b)如果查询表中所有的行(没有where)则优化器会选择全表扫描;

    c)如果从表中检索大量数据,索引可能没有任何优势。

    d)如果优化器没有准确的数据分布信息,它可能会选择错误的索引或根本没有索引;

    e)如果where语句中的子查询包含的某些列,则可能导致索引不可用。

  2. 什么时候应该用索引

    优化器选择索引扫描而不选择全表查询的情况基于以下几点:

    a)where语句中的列与现有索引正好匹配;

    b)有DISTINCT,UNION 和ORDER BY 则会用索引查询;

    c)有主键与外键约束则也会用索引;

    d)尽量避免使用order by 。

  3. WHERE语句的陷阱

    因为不好的where语句,可能导致扫描不走索引:

    a)在WHERE子句中使用列,它与索引中的列顺序不匹配;

    b)比较同一表中的列;

    c)选择的列是low-selectivity indexes;

    d)在其中一列使用了count然后让他与一个常量比较;

    e)在其中一列使用function然后让他与一个常量比较;

    f)使用了like

    g)与null 做比较

    h)使用了not

    i)使用了转换值

    j)使用了in

  4. 要编写好的SQL,请避免上面提到的陷阱并采纳以下建议:

    a)范围的话尽量使用between and

    b)如果外部查询有附件条件使用exists或not exists

    c)如果没办法避免order by 则尽量使用索引列

Examples:

黄金法则

  1. 如果代码中包含算数表达式,尽量把他转换成求值的结果;

  2. 在列中避免使用functions

  3. 当你知道一组值的分布时候,尽量别使用<>而是把他转换为>和<的表达式;

  4. 把or 转换为in;

  5. like 要比substring性能好;

  6. 尽量把union用or替代;

  7. 使用CASE来过滤最终的select list

  8. where语句必须按照这些列在索引中出现的顺序使用;

  9. 使用子查询来代替join可以提高一些分组连接的性能;

  10. 使用distinct来代替group by;

  11. 尽量不在语句中使用distinct 和order by 除非你真的需要...

  12. 尽量不用outer join

  13. 子查询中的表如果可以通过from 与主表连接,则尽量别使用子查询;

  14. 所有的表或视图都应该有key field

  15. 尽量使用union all 来代替union;

  16. 我的公众号:
原文地址:https://www.cnblogs.com/eason-liu/p/7136120.html