索引学习（一）

在海量信息发展的今天，如何快速的查找和定位到我们需要的数据成为一种挑战，而数据库索引也是这一挑战中最为基础的元素。

索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中，索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中，索引也允许数据库程序迅速地找到表中的数据，而不必扫描整个数据库。

1. 索引的类型

　　B-树索引
　　位图索引
　　HASH索引
　　索引编排表
　　反转键索引
　　基于函数的索引
　　分区索引
　　本地和全局索引

2. 索引优点：
2.1　　通过创建唯一性索引，可以保证数据库表中每一行数据的唯一性。

2.2　　可以大大提高数据的检索速度，这也是创建索引的最主要的原因。

2.3　　可以提高表和表之间的连接速度，特别是在实现数据的参考完整性方面特别有意义。

2.4　　在使用分组和排序子句进行数据检索时，同样可以显著减少查询中分组和排序的时间。

2.5　　通过使用索引，可以在查询的过程中，使用优化隐藏器，提高系统的性能。

3. 索引的缺点：
3.1　　创建索引和维护索引要耗费时间，这种时间随着数据量的增加而增加。

3.2　　索引需要占物理空间，除了数据表占数据空间之外，每一个索引还要占一定的物理空间，如果要建立聚簇索引，那么需要的空间就会更大。

3.3　　当对表中的数据进行增加、删除和修改的时候，索引也要动态的维护，这样就降低了数据的维护速度。

4. 应该建索引列的特点：

4.1　　在经常需要搜索的列上，可以加快搜索的速度；

4.2　　在作为主键的列上，强制该列的唯一性和组织表中数据的排列结构；

4.3　　在经常用在连接的列上，这些列主要是一些外键，可以加快连接的速度；

4.4　　在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的；

4.5　　在经常需要排序的列上创建索引，因为索引已经排序，这样查询可以利用索引的排序，加快排序查询时间；

4.6　　在经常使用在WHERE子句中的列上面创建索引，加快条件的判断速度。

5. 不宜建立索引的特性：

5.1　　对于那些在查询中很少使用或者参考的列不应该创建索引。
      　　这是因为，既然这些列很少使用到，因此有索引或者无索引，并不能提高查询速度。
      　　相反，由于增加了索引，反而降低了系统的维护速度和增大了空间需求。

5.2　　对于那些只有很少数据值的列也不应该增加索引。
     　　这是因为，由于这些列的取值很少，例如人事表的性别列，在查询的结果中，结果集的数据行占了表中数据行的很大比例，
   　　即需要在表中搜索的数据行的比例很大。增加索引，并不能明显加快检索速度。

5.3　　对于那些定义为blob数据类型的列不应该增加索引。
      　　这是因为，这些列的数据量要么相当大，要么取值很少。

5.3　　当修改性能远远大于检索性能时，不应该创建索引。
     　　这是因为，修改性能和检索性能是互相矛盾的。当增加索引时，会提高检索性能，但是会降低修改性能。
   　　当减少索引时，会提高修改性能，降低检索性能。因此，当修改性能远远大于检索性能时，不应该创建索引。

5.4　　含有Null值的列，不应该建立索引。




6. 限制索引（索引失效）的因素有：
6.1　　使用不等于操作符（<>、!=）
         下面的查询即使在cust_rating列有一个索引，查询语句仍然执行一次全表扫描。
         select cust_Id,cust_name from customers where cust_rating <> 'aa';

       把上面的语句改成如下的查询语句，这样，在采用基于规则的优化器而不是基于代价的优化器（更智能）时，将会使用索引。
       select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';

   特别注意：通过把不等于操作符改成OR条件，就可以使用索引，以避免全表扫描。

6.2　　使用IS NULL 或IS NOT NULL
       使用IS NULL 或IS NOT NULL同样会限制索引的使用，因为NULL值并没有被定义。
       在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时，把需要索引的列设成NOT NULL。
       如果被索引的列在某些行中存在NULL值，就不会使用这个索引（除非索引是一个位图索引，关于位图索引在稍后在详细讨论）。

6.3　　使用函数
        　　如果不使用基于函数的索引，那么在SQL语句的WHERE子句中对存在索引的列使用函数时，会使优化器忽略掉这些索引。
       　　下面的查询不会使用索引（只要它不是基于函数的索引）

        select empno,ename,deptno from emp where trunc(hiredate)='01-MAY-81';

        把上面的语句改成下面的语句，这样就可以通过索引进行查找。
        select empno,ename,deptno from emp where hiredate<(to_date('01-MAY-81')+0.9999);

6.4　　比较不匹配的数据类型
       　　也是比较难于发现的性能问题之一, 注意下面查询的例子，account_number是一个VARCHAR2类型,在account_number字段上有索引。

       下面的语句将执行全表扫描：
       select bank_name,address,city,state,zip from banks where account_number = 990354;
       Oracle可以自动把where子句变成to_number(account_number)=990354，这样就限制了索引的使用,改成下面的查询就可以使用索引：
       select bank_name,address,city,state,zip from banks where account_number ='990354';

       特别注意：不匹配的数据类型之间比较会让Oracle自动限制索引的使用, 即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”

6.5　　对索引列进行运算
      　　使用函数，类型不匹配，对索引列进行各类运算，都会导致索引失效。

6.6　　当使用LIKE关键字时，LIKE ‘%——’ 百分号在前面的，索引也会失效
6.7    单独的 >, < >=, <= 如果查询数据超出30%, 索引也会失效.

7. 选用适合的Oracle优化器

    1. Oracle的优化器共有3种:
        a. RULE (基于规则)
       b. COST (基于成本)
       c. CHOOSE (选择性)。




本文参考以下内容： http://www.2cto.com/database/201110/107271.html