《收获，不止Oracle》读书笔记

1、Oracle体系结构图：

① Oracle由实例和数据库组成，上半部的直角方框为实例instance，下半部的圆角方框为数据库databases。

② 实例是由一个开辟的内存区SGA(System Global Area)和一系列后台进程组成的，其中SGA最主要被划分为共享池（shared pool）、数据缓冲区（db cache）和日志缓冲区（log buffer）三类。后台进程包括PMON、SMON、LCKn、RECO、CKPT、DBWR、LGWR、ARCH等系列进程。

③ 数据库是由数据文件、参数文件、日志文件、控制文件、归档文件等系列文件组成的，其中归档日志最终可能会被转移到新的存储介质中，用于备份恢复使用。

④ PGA（Program Global Area）区，这也是一块开辟出来的内存区，和SGA最明显的区别在于，PGA不是共享内存，是私有不共享的，S理解为共享的首字母。用户对数据库发起的无论查询还是更新的任何操作，都是在PGA先预处理，然后接下来才进入实例区域，由SGA和系列后台进程共同完成用户发去的请求。

PGA起到的具体作用，也就是前面说的预处理，是什么呢？主要有三点：第一，保存用户的连接信息，如会话属性、绑定变量等；第二，保存用户权限等重要信息，当用户进程与数据库建立会话时，系统会将这个用户的相关权限查询出来，然后保存在这个会话区内；第三，当发起的指令需要排序的时候，PGA正是这个排序区，如果在内存中可以放下这个排序的尺寸，就在内存PGA区内完成，如果放不下，超出的部分就在临时表空间中完成排序，也就是在磁盘中完成。

⑤ 用户的请求发起经历的顺序一般如下：1区 -> 2区 -> 3区；或者1区 -> 2区。

后台进程介绍：

PMON：进程监视器，当其他进程出错时进行处理

SMON：系统监视器，重点工作在于instance recovery 除此之外，还有清理临时表空间、回滚段表空间和合并空闲空间

LCKn：仅适用于RAC数据库，最多可有10个进程，用于实力间的封锁

RECO：用于分布式数据库的恢复

CKPT：用于触发DBWR从数据缓冲区写出数据到磁盘

DBWR：负责将数据缓冲区中的数据写出到磁盘文件中

LGWR：负责将日志缓冲区的日志数据写出到REDO文件中

ARCH：负责磁盘日志文件的归档，转存到其他存储介质中

2、Oracle逻辑结构：

表空间（tablespace）：系统表空间、回滚段表空间、临时表空间、用户表空间。

段（segment）、区（extent）

块（block）：数据块的组成

① 数据块头：包含标准内容和可变内容

② 表目录区：数据所在的表信息

③ 行目录区：存放插入的行的地址

④ 可用空间区：块中的空余空间

⑤ 行数据区：存储具体的行信息或索引信息

1）、在建表空间时需要预先规划好表空间的大小，如果段的扩展导致表空间不够而需要表空间去扩大，那么开销是很大的，但如果预先分配过多空间，也是一种浪费，因此我们需要根据实际应用去平衡。

2）、delete操作是无法释放空间的，即没办法回收block块，在delete之后只是block中无数据，可block依然存在，在后续的insert时将填充delete的空block，因此普通的堆表无法满足有序插入有序读出（不适用 order by）。

3、Oracle表分类

1）、普通堆表

不足：

表更新有日志开销

表delete操作不能释放空间

表记录太大检索较慢

索引回表读开销很大

有序插入难有序读出

2）、全局临时表

分类：基于session、基于事务

优点：高效删除记录，退出session或commit结束事务，记录就删除；不同会话独立，避免锁竞争，利于并行

3）、分区表

分类：range分区（范围分区），list分区（列表分区），hash分区（散列分区），组合分区

分区表的特性：

① 高效的分区消除

② 强大的分区操作：分区truncate消除数据比较快速，并不同于delete，可释放空间；分区数据转移；分区切割想分就分，可将某个分区切割成多个分区，以达到增加分区数量的目的；分区合并想合就合；分区的增删非常简单

③ 分区索引类型：全局索引；局部索引

④ 分区表相关陷阱：对分区进行truncate操作之后，全局索引失效，局部索引正常，为了避免全局索引失效，在对分区进行删除、转移、切割、合并、增加等操作时，可在命令后加“update global indexes”关键字；有索引效率反而更低；无法应用分区条件

4）、索引组织表：在create table的语句之后增加 organization index 关键字

优点：不需要回表查询主键之外的列，性能更高

缺点：更新操作代价较高

4、索引

1）、创建索引有哪些操作

① 建索引先排序：将需要建索引的列和rowid取出排好序放在内存中

② 列值入块成索引：依次将内存中的顺序存放的列的值和对应的rowid存进Oracle空闲的Block块中，形成索引块

③ 填满一块接一块：当块1被填满时，会接着填到其他空闲块，如块2，此时会有另外一件重要的事情发生，会产生一个茎块B1用来管理块1和块2

④ 同级两块则会产生上层块来管理下级块，直到root根节点

2）、索引结构的三大特点

① 索引高度较低

② 索引存储列值及能定位到行数据在数据表中的位置的rowid

③ 索引本身有序

3）、应用索引三大特性进行查询优化

① 索引高度较低的妙用：由于索引结构导致高度较低，因此在表数据量相差甚远的情况下，运用索引，查询速度会相差无几，都会比较快，此种情况仅限于查询结果比较少的情况，如果需要返回表中的绝大部分数据，那用索引反而会更慢，不如全表扫描，原因是索引也是快，如果一个索引3层，100万数据，那么就需要300万次IO，因此性能会下降

② 分区索引的设计误区：如果在分区表中查询时不能使用到分区条件，那么建立分区索引是根据分区个数创建的，如果查询没有使用分区条件，就会去所有索引块中查找，那么此时的索引高度将变得极高，IO次数变多，性能下降

③ count(*) 优化：索引不能存储空值，索引列必须设置成不能为空，可以用 where object is not null 解决；当表中字段很少，比如只有一个字段，那此时使用索引会比全表扫描更慢，因为索引中存储了字段以外的rowid数据，总体来说比原表数据更大了

④ sum/avg 优化：允许为空的列仍然不能使用索引

⑤ max/min 优化：能使用允许为空的列的索引；执行计划只有两次逻辑读，这是因为索引的结构导致的结果，max只要去最右边的最后一列查询，min则去最左边第一列查询即可，因为索引是有序的；select min(object_id),max(object_id) from t 不能使用索引，因为object_id列属性允许为空，select min(object_id),max(object_id) from t where object_id is not null可以使用索引，但是 INDEX FAST FULL SCAN 类型索引，select max,min from(select max(object_id) max from t) a, (select min(object_id) min from t) b 能使用索引，并是 INDEX FULL SCAN(MIN/MAX)类型索引，逻辑读比第二种少了非常多

⑥ 索引回表与优化：应尽量不要使用 select * from t，这样会导致全表扫描操作；善用联合索引，联合索引字段不宜超过3个；（聚合因子：表和索引两者的列的排序相似度），如果表的插入顺序和索引列的顺序基本一致，那么从索引回表查找数据块将会更容易，这就是聚合因子底对查询优化的帮助

⑦ order by 排序优化：在 order by 列上加索引，能有效提升查询效率

⑧ distinct 优化：索引能消除 distinct 触发的排序，提升效率

⑨ 索引全扫描和快速全扫描：INDEX FULL SCAN 和 INDEX FAST FULL SCAN 在如count(*) 和 sum 这种不需要排序的查询时使用快速全扫描，而在涉及排序语句时，就要权衡利弊了，也许使用全速全扫描，也许使用非快速扫描，由oracle优化器计算出成本值决定

⑩ union 合并优化：在使用union时索引是不能消除排序的，因为这是两个结果集的筛选

4）、不得不说的主外键设计

① 外键上的索引与性能：外键上建索引能对连接查询有很大的性能提升

② 外键索引与锁的避免：在外键上建立索引不但能提升查询性能，还能有效避免锁竞争

③ oracle支持级联删除，需慎用

5）、联合索引

① 在等值查询情况下，组合索引的列无论哪一列在前，性能都一样

② 组合索引的列，当一列是范围查询，一列是等值查询的情况下，等值查询列在前，范围查询列在后，这样的索引才能提高性能

分析：因为索引有序，当两个查询列都为等值时，遍历索引块的次数一样，当一列为范围时，如果该列在前那么遍历将不会那么容易停下，相反，等值列在前时，将很快停止遍历，也即是遍历列更少，当然会更快

③ 设计需考虑单列的查询：如果单列的查询列和联合索引的前置列一样，那单列可以不建索引，直接利用联合索引来进行检索数据

6）、数据更新会受到索引影响，因此在需要插入数据时，应该先使索引失效，在数据插入完成之后，重新创建索引

7）、创建索引的过程会引发大量排序和锁竞争

8）、可以通过监控索引来蚌段索引是否被使用过，从而删除根本用不到的索加监控命令：alter index 索引名 monitoring usage；撤销命令：alter index 索引名 nomonitoring usage

9）、位图索引

① 位图索引在进行count(*)统计操作时性能比B树索引快近100倍，并且位图索引可以保存空值

② 位图索引的适用场景需要满足以下两个条件：位图索引列大量重复

10）、函数索引：create index idx_upper_obj_name on t(upper(object_name))

5、表的连接：嵌套循环、哈希连接、排序合并

1）、在嵌套循环连接中，驱动表返回多少条记录，被驱动表就返回多少记录

2）、在hash连接中，驱动表和被驱动表都只会访问0次或1次

3）、排序合并连接和hash连接一样，两张表都只会访问0次或1次，合并连接根本就没有驱动和被驱动的概念

4）、嵌套循环连接要特别注意驱动表的排序，小的结果集先访问，大的结果集后访问，才能保证被驱动表的访问次数降到最低，从而提升性能

5）、嵌套循环连接和hash连接有驱动顺序，驱动表的顺序不同将影响表连接的性能，而排序合并连接没有驱动的概念，无论那张表在前都无妨

6）、嵌套循环连接和hash连接不需要排序，而排序合并则需要排序，在取字段时，尽可能少的取字段，排序需要消耗内存

7）、hash连接不支持不等值连接 "<>"、">" 和 "<" 的连接方式，也不支持like的连接方式；排序合并连接不支持"<>"的连接条件，也不支持like的连接，但支持 ">" 之类的连接条件；嵌套循环无限制

8）、最适合嵌套循环连接的场景

① 两表关联返回的记录不多，几遍两张表的记录奇大无比，也是非常迅速的

② 遇到一些不等值查询导致哈希和排序合并连接被限制使用时，不得不使用嵌套循环连接

*****连接查询优化*****：驱动表的限制条件所在列加索引；被驱动表的连接条件所在列加索引

9）、哈希连接与索引

① 索引的连接条件起不到快速检索的作用，但是限制条件列如果有合适的索引，可以快速检索少量记录，还是可以提升性能的

② 哈希连接需要在PGA中的HASH_AREA_SIZE中完成，因此增大HASH_AREA_SIZE也是优化哈希连接的一种有效途径，一般在内存自动管理的情况下只要加大PGA区大小即可

10）、排序合并与索引：排序合并连接上的连接条件虽然没有检索的作用，却有清除排序的作用

原文：https://blog.csdn.net/eric520zenobia/article/details/80922035