7.30实习培训日志-SQL优化

总结

今天早上考试，下午主要是老师引导我们学习SQL优化，晚上主要是同学的技术分享，杨松柏同学主要给我们分享了java的io的一些东西，c10k问题，bio（同步阻塞IO），NIO(同步非阻塞IO),netty,对于NIO的进一步封装，主要因为NIO用起来很麻烦。邵闫利主要给我们讲解了java基础，特别强调设计模式的应用，工厂模式，观察者模式，装饰器模式三者，给我们通俗易懂的讲解虽然我还是不太懂，下来自己去看一下设计模式，后面的同学都给我们讲解了一些新的知识，git rebase,k8s子类的东西，收获良多。

杂项

用in和exists替换distinct

能用union不要用union all

驱动表

wwh999 在 2006年总结说，当进行多表连接查询时， [驱动表] 的定义为：

指定了联接条件时，满足查询条件的记录行数少的表为[驱动表];
未指定联接条件时，行数少的表为[驱动表]（Important!）。

优化

LEFT JOIN改为JOIN
除所有JOIN，让MySQL自行决定

连表查询之驱动表

基于案例学习的sql优化

从案例中推导SQL优化的总体思路与误区

count(*) count(列)

无索引：count(*) count(列)一样

有索引：列非空（count() count(列)一样）（列可空）count() count(列)不一样

但是count(*)与 count(列)不等价

count(*):会统计null列，count(列)不会计算Null列

count()速度最快，列的偏移量决定性能，列越靠后，访问开销越大，count()与列无关，所以count(*)速度最快，count(最后列)速度最慢

sql书写顺序

表的连接顺序

大表在前，小表在后是基于规则的时代(select /*+rule*/ count(*) from tab_big,tab.small)，现在是基于代价的时代，两种写法一样的。

表的条件顺序

过滤条件越多，越放在后面-> 错

not in,not exists

anti反连接算法比filter高效，10g中，oracle指定非空，not in才用anti算法.11g中not in 和not exists一样，无论是否非空，都走anti算法。

设计

全局临时表

delete删除开销大，占用大量回滚段和产生大量日志。

CREATE GLOBAL TEMPORARY TABLE temp_table_session (...) ON COMMIT (PRESERVE|DELETE) ROWS

session全局临时表：退出session记录清空

基于事务全局临时表：commit表记录清空

分区表

create table range_part_tab (id number,deal_date date,area_code number,contents varchar2(4000))
partition by range (deal_date)
(
partition p1 values less than (TO_DATE('2012-02-01', 'YYYY-MM-DD')),
...
partition p_max values less than (maxvalue)
)
;

oracle的分表详解 -----表分区

历史数据管理

开发

避免SQL中函数调用

用表连接代替函数调用

用集合写法

只取所需列

访问视图变快，可以避免访问更多表
可以通过索引得到列，无需回表
表连接变快，避免连接更多的表

超长SQL优化

case when相同代码封装
group by简化case when（部分适用）

根据场景选择技术

索引坏处

先插入数据，再创建索引。
在有索引时插入数据很慢，需要保持数据有序
分成两个库(一个生产库，很少索引)(一个查询库，很多索引)

分区慢：分区不加where会使性能变慢

位图索引：位图索引适合只有几个固定值的列，如性别、婚姻状况、行政区等等，而身份证号这种类型不适合用位图索引。

等价改写

-- 不等价 一份复制，两份粘贴
insert all into ljb_tmp_transaction into ljb_tmp_session select * from dba_objects
-- 不等价，同一时刻记录不一样
insert into ljb_tmp_transaction as select * from dba_objects;
insert into jb_tmp_session as select * from dba_objects;

-- 没有办法同时扫描叶子，性能比第二条差，但是不等价
select min(object_id),max(object_id) from t;
-- 不是同一时刻
select max(object_id) from t;
select min(object_id) from t;
-- a，b同时一条，索引不会有笛卡尔积 和第一条等价，性能好
select max, min
from (select max(object_id) max from t ) a,
(select min(object_id) min from t ) b;

in性能好于>,<

需求是顶级优化

BIO，NIO，AIO的区别