Oracle 指数一个简短的引论

1 索引创建语法：
CREATE UNIUQE | BITMAP INDEX <schema>.<index_name>
ON <schema>.<table_name>
(<column_name> | <expression> ASC | DESC,
<column_name> | <expression> ASC | DESC,...)
TABLESPACE <tablespace_name>
STORAGE <storage_settings>
LOGGING | NOLOGGING
COMPUTE STATISTICS
NOCOMPRESS | COMPRESS<nn>
NOSORT | REVERSE
PARTITION | GLOBAL PARTITION<partition_setting>

相关说明
1）UNIQUE | BITMAP：指定UNIQUE为唯一值索引。BITMAP为位图索引，省略为B-Tree索引。
2）<column_name> | <expression> ASC | DESC：能够对多列进行联合索引，当为expression时即“基于函数的索引”
3）TABLESPACE：指定存放索引的表空间(索引和原表不在一个表空间时效率更高)
4）STORAGE：可进一步设置表空间的存储參数
5）LOGGING | NOLOGGING：是否对索引产生重做日志(对大表尽量使用NOLOGGING来降低占用空间并提高效率)
6）COMPUTE STATISTICS：创建新索引时收集统计信息
7）NOCOMPRESS | COMPRESS<nn>：是否使用“键压缩”(使用键压缩能够删除一个键列中出现的反复值)
8）NOSORT | REVERSE：NOSORT表示与表中同样的顺序创建索引，REVERSE表示相反顺序存储索引值
9）PARTITION | NOPARTITION：能够在分区表和未分区表上对创建的索引进行分区

2 索引特点：
第一。通过创建唯一性索引，能够保证数据库表中每一行数据的唯一性。

第二，能够大大加快数据的检索速度。这也是创建索引的最基本的原因。
第三，能够加速表和表之间的连接，特别是在实现数据的參考完整性方面特别有意义。
第四，在使用分组和排序子句进行数据检索时。相同能够显著降低查询中分组和排序的时间。

第五，通过使用索引，能够在查询的过程中，使用优化隐藏器。提高系统的性能。

3 索引不足：
第一，创建索引和维护索引要耗费时间，这样的时间随着数据量的添加而添加。
第二，索引须要占物理空间，除了数据表占数据空间之外，每个索引还要占一定的物理空间，假设要建立聚簇索引，那么须要的空间就会更大。

第三，当对表中的数据进行添加、删除和改动的时候。索引也要动态的维护。这样就减少了数据的维护速度。

4.限制索引
限制索引是一些没有经验的开发者常常犯的错误之中的一个。

在SQL中有非常多陷阱会使一些索引无法使用。以下讨论一些常见的问题：

4.1 使用不等于操作符（<>、!=）
以下的查询即使在cust_rating列有一个索引，查询语句仍然运行一次全表扫描。
select cust_Id,cust_name from customers where cust_rating <> 'aa';
把上面的语句改成例如以下的查询语句。这样，在採用基于规则的优化器而不是基于代价的优化器（更智能）时。将会使用索引。

select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';
特别注意：通过把不等于操作符改成OR条件，就能够使用索引，以避免全表扫描。

4.2 使用IS NULL 或IS NOT NULL
使用IS NULL 或IS NOT NULL相同会限制索引的使用。由于NULL值并没有被定义。在SQL语句中使用NULL会有非常多的麻烦。
因此建议开发者在建表时。把须要索引的列设成NOT NULL。假设被索引的列在某些行中存在NULL值，就不会使用这个索引
（除非索引是一个位图索引，关于位图索引在稍后在具体讨论）。

4.3 使用函数
假设不使用基于函数的索引，那么在SQL语句的WHERE子句中对存在索引的列使用函数时，会使优化器忽略掉这些索引。
以下的查询不会使用索引（仅仅要它不是基于函数的索引）
select empno,ename,deptno from emp where trunc(hiredate)='01-MAY-81';
把上面的语句改成以下的语句，这样就能够通过索引进行查找。
select empno,ename,deptno from emp where hiredate<(to_date('01-MAY-81')+0.9999);

4.4 比較不匹配的数据类型
也是比較难于发现的性能问题之中的一个。注意以下查询的样例，account_number是一个VARCHAR2类型,在account_number字段上有索引。
以下的语句将运行全表扫描：
select bank_name,address,city,state,zip from banks where account_number = 990354;
Oracle能够自己主动把where子句变成to_number(account_number)=990354，这样就限制了索引的使用,改成以下的查询就能够使用索引：
select bank_name,address,city,state,zip from banks where account_number ='990354';
特别注意：不匹配的数据类型之间比較会让Oracle自己主动限制索引的使用,即便对这个查询运行Explain Plan也不能让您明确为什么做了一次“全表扫描”

5 查询索引
查询DBA_INDEXES视图可得到表中全部索引的列表，注意仅仅能通过USER_INDEXES的方法来检索模式(schema)的索引。

訪问USER_IND_COLUMNS视图可得到一个给定表中被索引的特定列。

6 组合索引
当某个索引包括有多个已索引的列时。称这个索引为组合（concatented）索引

7 索引的类型
B-树索引、位图索引、HASH索引、索引编排表、反转键索引、基于函数的索引、分区索引、本地和全局索引

7.1 B树索引(默认类型)
B-tree 特点：
适合与大量的增、删、改（OLTP）
不能用包括OR操作符的查询。
适合高基数的列（唯一值多）
典型的树状结构；
每一个结点都是数据块。
大多都是物理上一层、两层或三层不定，逻辑上三层；
叶子块数据是排序的，从左向右递增；
在分支块和根块中放的是索引的范围。
注：B*Tree索引在检索高基数数据列（高基数数据列是指该列有非常多不同的值）时提供了最好的性能。
当取出的行数占总行数比例较小时B-Tree索引比全表检索提供了更有效的方法。但当检查的范围超过表的10%时就不能提高取回数据的性能。

7.2 位图索引
Bitmap 特点：
适合与决策支持系统；
做UPDATE代价很高。
很适合OR操作符的查询；
基数比較少的时候才干建位图索引。
注：位图索引最好用于低cardinality列（即列的唯一值除以行数为一个非常小的值，接近零）。
比如又一个“性别”列，列值有“Male”，“Female”。“Null”等3种。但一共同拥有300万条记录，那么3/3000000约等于0。这样的情况下最适合用位图索引

7.3 函数索引
能够在表中创建基于函数的索引。

假设没有基于函数的索引。不论什么在列上运行了函数的查询都不能使用这个列的索引。

必须设置下面两个系统參数：
QUERY_REWRITE_ENABLED=TRUE
QUERY_REWRITE_INTEGRITY=TRUSTED

Oracle 指数 一个简短的引论

Oracle 指数一个简短的引论