Oracle Shared Pool内部机制探讨

最近比较忙，一直没来这里了，前几天忽然想到要研究下shared pool，这个词大家可能都不陌生，但很多人包括专业DBA，也并不清楚shared pool的结构和原理，一是这部分确实是oracle内存结构中最复杂的一个部分，另一个是这方面的资料比较少，本人通过对资料的搜集、整理、翻译，最后得到下面这段文字，希望能和大家共享，同时，也希望能对大家有所启发和提高（因最近比较忙，没有时间进一步校验，文中可能存在不妥，欢迎指正）：

一、简介

什么是共享池呢？首先，让我们对共享池做一个简短的介绍。大多数人们知道共享池是SGA的一部分，这点属实，但还不仅仅这些，那么，共享池到底是什么呢？

共享池包括许多oracle的内存区域，在实例调整过程中，我们必须调整的主要区域就是共享池。如果共享池的配置不正确，整个数据库会出现性能问题。

共享池主要和SGA的两个部分相关，一部分是固定区域，对特定版本的oracle实例来说，这部分是不变的。第二部分是可变区域，它会随着用户和应用的需求而收缩和增长。

现在我们详细看看共享池的各个组件，共享池大体可分为三个主要部分：

u 库缓冲

u 字典缓冲

u 控制结构

二、库缓冲

所有的SQL及PL/SQL都在这部分内存中执行，所有存储的SQL语句的执行计划也会保留在这里。

我们可以进一步把库缓冲划分为：

u 共享及私有SQL区

u PL/SQL过程部分

1、共享及私有SQL区

共享SQL区包括单条或相类似SQL语句的解析树和执行计划。Oracle通过多个类似DML语句共享一个共享SQL区来节省内存，特别是多个用户执行同一个应用的情况。

共享SQL区总是在共享池中。当SQL语句解析时，Oracle会从共享池中为其分配内存，分配内存的大小和SQL语句的复杂度有关。如果一个SQL语句要求分配一个新的共享SQL区，但共享池中没有剩余自由空间，那么，Oracle会按照最近最少使用算法（LRU）来确定从共享池中释放的内存条目，直到有足够的自由空间来满足该新的SQL共享区为止。

私有SQL区包括类似绑定信息和运行缓冲的数据。每个发布SQL语句的会话有一个私有SQL区。每个提交相同SQL语句的用户都会有自己的私有SQL区，而这些私有SQL区共享一个共享SQL区；很多私有SQL区能和一个相同共享SQL区相关。

每个私有SQL区有一个持久区和运行时区（临时区）：

1) 持久区包括跨越多次执行的绑定信息，完成数据类型转换的代码（当定义的数据类型和选择列的数据类型不一致时），还包括其他的状态信息（象递归或远程游标数或并行查询状态等）。持久区的大小和语句中绑定变量及列的数目相关。例如：如果在查询中确定了多个列，那么持久区会比较大。

2) 运行时区包括语句执行时用到的信息。运行时区的大小依赖正被执行的SQL语句的类型和复杂度，以及被语句处理的行的大小。一般来说，INSERT,UPDATE和DELETE语句的运行时区比SELECT语句的稍小，特别当SELECT语句要求排序时。

作为执行请求的第一步，Oracle会创建运行时区。对INSERT,UPDATE和DELETE语句，Oracle在语句执行完后释放运行时区。对查询，Oracle会在所有行被取回或查询被取消后释放运行时区。

私有SQL区的位置和会话建立连接的方式相关。如果一个会话通过专用服务器方式连接，私有SQL区在用户的PGA中分配。如果会话通过多线程服务器连接，持久区和select语句的运行时区会在SGA中。表（x$ksmms）提供特定Oracle实例的库缓冲中，有关SQL区的运行时信息。

例如：

SELECT *

FROM X$KSMSS

WHERE KSMSSNAM = 'sql_area' AND KSMSSLEN <> 0;

2、 PL/SQL过程部分

Oracle处理PL/SQL程序单元（过程，函数，包，匿名块和数据库触发器）时，很大程度上和处理单条SQL语句的方式类似。

Oracle分配一个共享区来容纳解析的、编译的程序单元。Oracle分配私有区来容纳会话执行程序单元时的特定值，包括：局部，全局和包变量（也叫做包实例）及执行SQL的缓冲。如果多个用户执行同一程序单元，那么它们会使用一个共享区，而每个用户都有自己的私有SQL区，以便用来容纳每个会话的特定值。

被包含在程序单元内的各条SQL语句象以前部分描述的一样被处理。不管这些SQL语句来自哪个PL/SQL程序单元，它们都用一个共享区来容纳解析形式，而每个会话都用自己的私有区来执行语句。

（x$ksmms）表提供特定Oracle实例的库缓冲中，PL/SQL的运行时信息。例如：

SELECT *

FROM X$KSMSS

WHERE KSMSSNAM LIKE 'PL/SQL%' AND KSMSSLEN <> 0;

PL/SQL MPCODE：代表依赖机器的伪码。stands for machine dependent pseudocode.

PL/SQL DIANA：代表共享池中PL/SQL代码运行时的大小。

3、库缓冲管理器

库缓冲的主要目的是提供一个快速定位和存储库缓冲对象的机制。一种哈希机制用来定位一个句柄，该句柄包含对象的鉴定符（名字）。库缓冲句柄会指向一个或多个库缓冲对象及其内容。

库缓冲缓存各种库对象（例如：包，过程，函数，共享游标，匿名PL/SQL块，表定义，视图定义，表格定义等）。

库缓冲会从最顶端堆或普通SGA堆分配。当库缓冲、KGL需要更多内存时，库缓冲会调用对管理器（KGL）来进行分配。库缓冲包括一个哈希表，该哈希表包括一组哈希桶。每个哈希桶是一个库缓冲对象句柄的双向链表。每个库缓冲对象句柄指向一个库缓冲对象并有一个参照列。库缓冲对象进一步细分为其他组件，例如：依赖表，子表和授权表（这里仅举几个例子）。

KGH Heap Manager 说明：

Shared pool和PGA都由一个Oracle的内存管理器来管理，我们称之为KGH heap manager。Heap Manager不是一个进程，而是一串代码。Heap Manager主要目的是满足server 进程请求memory 的时候分配内存或者释放内存。Heap Manager管理PGA时，需要和操作系统打交道来分配或者回收内存。但是，shared pool中，内存是预先分配的，Heap Manager管理所有的空闲内存。

当某个进程需要在shared pool分配内存时，Heap Manager就满足该请求，Heap Manager也和其他ORACLE模块一起工作来回收shared pool的空闲内存。

4、库缓冲管理器（Library Cache Manager）（哈希表和哈希桶（Hash Table and Hash Bucket)）

库缓冲管理器（Library cache Manager）可以看做是堆管理器（Heap Manager）的客户端，因为库缓冲管理器通过堆管理器来分配内存来存放库缓冲对象。库缓冲管理器控制所有库缓冲对象，包括包、过程、游标、触发器等。

库缓冲包括一个哈希表，哈希表又由哈希桶组成，哈希桶又由一些相互指向的库缓冲对象句柄组成，库缓冲对象句柄指向具体库缓冲对象以及一些引用列表。

哈希表是一组哈希桶。初始哈希桶数是251，然而，当表中的对象数超过下一个数时，桶数会增加。

下一个数是指下一个较高的质数。他们分别是251、509、1021、2039、4093、8191、16381、32749、65521、131071和4292967293，这里第”n+1”个大小接近第“n”个大小的两倍。哈希表膨胀的结果会导致分配下一个数大小的新哈希表，接着，把旧哈希表里的库缓冲对象重新哈希到新哈希表里，并且，释放旧哈希表的空间。整个过程，对哈希表的访问会被阻塞（通过冻结对子栓的存取），因为一个用户分配新桶使得哈希表扩大至两倍，然后，用哈希值的最低有效位数确定一个句柄属于哪个新桶。和通常的想法相反，这是个少见而不昂贵的操作，它也许会引起系统短暂（大概3-5秒）的小问题。

哈希表从来不会收缩。库缓冲管理器会对被给对象的名字空间、对象名、属主和数据库连接应用一个模哈希函数，以便确定在哪个桶里能找到该对象。

接着，会沿着链表搜索，以确定对象是否在那里。如果对象不存在，库缓冲管理器会创建一个空对象，并以给出的名字命名，把它插入到哈希表，并请求客户端调用客户端环境依赖加载函数加载它。

基本上，客户端会从磁盘上读取，调用对管理器来分配内存，并加载对象。

5、库缓冲句柄（Library Cache Handle）

一个库缓冲句柄指向一个库缓冲对象。它包括库缓冲对象的名字、名字空间、一个时间戳、一个参照列、一个锁该对象锁的列表和一个pin该对象的pins的列表。每个对象在名字空间内通过名字唯一标识。

对库缓冲中所有对象的访问是通过库缓冲句柄来实现的，也就是说，我们想要访问库缓冲对象，我们必须先找到库缓冲句柄。库缓冲句柄指向库缓冲对象,它包含库缓冲对象的名字，名字空间，时间戳，引用列表，lock对象以及pin对象的列表等。

库缓冲句柄也被库缓冲用来记录哪个用户在这个句柄上有锁，或者是哪个用户正在等待获得这个锁。那么，这里我们也知道了库缓冲锁是发生在句柄上的。

当一个进程请求库缓冲对象时,库缓冲管理器会应用一个哈希算法，得到一个哈希值，根据相应的哈希值到相应的哈希桶里去寻找。

这里的哈希算法原理与buffer cache中快速定位block原理是一样的。如果库缓冲对象在内存中，那么这个库缓冲句柄就会被找到。有时候，shared pool不够大，库缓冲句柄会保留在内存中，而库缓冲堆由于内存不足被清出内存（age out），这时，我们请求的对象堆（object heap）就会被重载。最坏的情况下，库缓冲句柄在内存中没有找到，这时就必须分配一个新的库缓冲句柄，对象堆也会被加载到内存中。

查看namespace:

SYS@anqing2(rac2)> select namespace from v$librarycache;

NAMESPACE

---------------

SQL AREA

TABLE/PROCEDURE

BODY

TRIGGER

INDEX

CLUSTER

OBJECT

PIPE

JAVA SOURCE

JAVA RESOURCE

JAVA DATA

库缓冲对象是由一些独立的堆组成，库缓冲句柄指向库缓冲对象，其实，句柄是指向第一个堆,这个堆我们就称之为heap 0。Heap 0记录了指向其他heap的指针信息。

库缓冲管理器将为每个对象产生一个名字，甚至对象为匿名块。句柄用名字空间按照类型来分区库缓冲对象。

这些不同类型名字空间的例子：一个名字空间容纳所有依赖PL/SQL对象的名字空间，一个为包体和表体，一个为共享游标，一个为触发器，一个为索引，一个为簇。名字空间描述库缓冲中一个项目的类型。

名字包括对象属主名，对象名，数据库链接名和数据库属主名。通过v$librarycache可以看到一个综合列表。

如果一个句柄目前没被参照并且没被标识为被保持，那么该句柄能被释放。我们用它来确定一个句柄何时能在内存中被unpinned。

6、库缓冲锁/pin（Library cache lock/pin）

库缓冲锁/pin用来控制对库缓冲对象的并发访问。锁管理并发，pin管理一致性，锁针对库缓冲句柄, pin针对堆。

当我们想要访问某个库缓冲对象时，首先要获得指向这个对象的句柄的锁，获得这个锁后，我们就需要pin住指向这个对象的heap。

当我们对包、存储过程、函数、视图进行编译时，Oracle就会在这些对象的句柄上先获得一个库缓冲锁，然后，再在这些对象的heap上获得pin，这样，就保证在编译时其它进程不会来更改这些对象的定义，或者将对象删除。

当一个session对SQL语句进行硬解析时，该session就必须获得库缓冲锁，这样，其他session就不能访问或更改这个SQL所引用的对象。如果这个等待事件花了很长时间，通常表明共享池太小(由于共享池太小，需要搜索free的chunk，或将某些可以被移出的对象清除，这样要花很长时间)，当然，也有可能另外的session正在对object进行修改(比如split 分区),而当前session需要引用那个table，那么这种情况下我们必须等另外的session进行完毕。

库缓冲锁有3中模式：

u Share(S)：当读取一个库缓冲对象时获得

u Exclusive(X)：当创建/修改一个库缓冲对象时获得

u Null(N)：用来确保对象依赖性

比如：一个进程要编译某个视图，就会获得一个共享锁，如果我们要create/drop/alter某个对象，就会获得exclusive lock。Null锁非常特殊，在任何可以执行的对象(cursor，function)上面都拥有NULL锁，我们可以随时打破这个NULL锁，当这个NULL锁被打破了,就表示这个对象被更改了，需要重新编译。

NULL锁主要目的就是标记某个对象是否有效。比如一个SQL语句在解析的时候获得了NULL 锁，如果这个SQL的对象一直在共享池中，那么这个NULL锁就会一直存在下去，当这个SQL语句所引用的表被修改后，该NULL锁就被打破了，因为修改这个SQL语句的时候会获得Exclusive 锁，由于NULL锁被打破了，下次执行这个SQL的时候就需要重新编译。

库缓冲pin有2种模式：

u Share(S)：读取object heap

u Exclusive(X)：修改object heap

当某个session想要读取对象heap，就需要获得一个共享模式的pin，当某个session想要修改对象heap，就需要获得排他的pin。当然，在获得pin之前必须获得锁。

在Oracle10gR2中，库缓冲pin被库缓冲mutex取代。

7、库缓冲闩（Library cache Latch）

库缓冲闩用来控制对库缓冲对象的并发访问。前面已提到，访问库缓冲对象前必须获得库缓冲锁，锁不是一个原子操作(原子操作就是在操作程中不会被打破的操作，很明显，这里的锁可以被打破), Oracle为了保护这个锁，引入了库缓冲闩机制，也就是说，在获得库缓冲锁前，需先获得库缓冲闩，当获得库缓冲锁后就释放库缓冲闩。

如果某个库缓冲对象没在内存中，那么这个锁就不能被获取，这时，需要获得一个库缓冲加载锁闩（library cache load lock latch），然后，再获取一个库缓冲加载锁（library cache load lock），当该加载锁获得后，释放库缓冲加载锁闩。

库缓冲闩受隐含参数_KGL_LATCH_COUNT控制，默认值为大于等于系统中CPU个数的最小素数，但Oracle对其有一个硬性限制，该参数不能大于67。

注意：我们去查询_kgl_latch_count有时候显示为0,这是一个bug。

Oracle用下面算法来确定库缓冲对象句柄由哪个子闩（latch）来保护：

latch# = mod(bucket#, #latches)

也就是说，用哪个子闩保护某个句柄是根据该句柄所在的桶号，以及总共有多少个子latch来进行哈希运算得到。

三、字典缓冲（Dictionary Cache）

应用用户打算对其做查询的表定义包括表的相关索引、列及授权信息。

SELECT *

FROM X$KSMSS

WHERE KSMSSNAM LIKE 'PL/SQL%' AND KSMSSLEN <> 0;

四、控制结构（Control Structure）

这部分包括关于内部闩和锁（数据结构）相关的信息，也包括缓冲头（buffer header），进程会话及事务数组。

这些数组大小依赖于init.ora文件中初始化参数的设置，并且，只有关闭数据库才能改变这些数组大小。

1、共享池块（Shared Pool Chunks）

我们仔细研究了共享池，为此，我们应该对表x$ksmsp进行仔细研究，该表中的每行都显示一个共享池块：

select * from X$ksmsp

当分配每个共享池块时，代码被转到做分配工作的一个函数，这个地址对列KSMCHCOM是可见的，它描述了分配的目的。这个块应该比对象要大很多，因为还包含了头信息。

列KSMCHCLS表示类，基本来说有四类：

Freeabl：能被释放，只是包含了会话调用时需要的对象。

Free ：空闲且不被有效对象包含。

Recr ：被临时对象包含。

Perm ：被永久对象包含。

SELECT KSMCHCLS CLASS,

COUNT (KSMCHCLS) NUM,

SUM (KSMCHSIZ) SIZ,

TO_CHAR ( ( (SUM (KSMCHSIZ) / COUNT (KSMCHCLS) / 1024)), '999,999.00')

|| 'k'

"AVG SIZE"

FROM X$KSMSP

GROUP BY KSMCHCLS;

注意：

在生产库上查询X$KSMSP时，要看下系统繁忙程度或负载高低，因为可能会导致数据库hang住。

因此总得汇总：

SELECT KSMCHCOM name,

COUNT (KSMCHCOM),

SUM (DECODE (KSMCHCLS, 'recr', KSMCHSIZ)) RECREATABLE,

SUM (DECODE (KSMCHCLS, 'freeabl', KSMCHSIZ)) FREEABLE

FROM x$ksmsp

GROUP BY KSMCHCOM;

2、 LRU列表（LRU List）

当进程启动时，会分配一些内存，当内存分配失败时，它会试着从共享内存中移去包含可重新创建对象的块，以得到需要的块大小。基于LRU（Least Recent Used）从内存中移去对象意味着那些频繁被pin的对象被保持在内存中，而不频繁被pin的对象通常会被移除内存,其次，过度和其他等临时对象会被移出内存。

ORA-04331 ‘unable to allocate x bytes of shared pool’当所有的空闲内存被完全耗尽时（稍后，我们将讨论共享池碎片）。

有一个众所周知的被维护列表是保留列表，它一般是共享池总大小的5%，并且，保留大小通过init.ora文件里的shared_pool_reserved_size参数配置。

通过v$shared_pool_reserved视图，我们可以看到保留列表的大小，REQUEST_MISS显示大块申请丢失的次数。

Oracle & Mysql & Postgresql & MSSQL 调优 & 优化
----------------------------------------------------------
《高性能SQL调优精要与案例解析》
blog1：http://www.cnblogs.com/lhdz_bj
blog2：http://blog.itpub.net/8484829
blog3：http://blog.csdn.net/tuning_optmization