索引学习(一)

在海量信息发展的今天,如何快速的查找和定位到我们需要的数据成为一种挑战,而数据库索引也是这一挑战中最为基础的元素。

索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。

1.  索引的类型

  B-树索引   
  位图索引  
  HASH索引    
  索引编排表
  反转键索引
  基于函数的索引 
  分区索引  
  本地和全局索引

2. 索引优点:
2.1  通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。

2.2  可以大大提高数据的检索速度,这也是创建索引的最主要的原因。

2.3  可以提高表和表之间的连接速度,特别是在实现数据的参考完整性方面特别有意义。

2.4  在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

2.5  通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

3. 索引的缺点:
3.1  创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

3.2  索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。

3.3  当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。


4. 应该建索引列的特点:

4.1  在经常需要搜索的列上,可以加快搜索的速度;

4.2  在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

4.3  在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;

4.4  在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

4.5  在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

4.6  在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

5. 不宜建立索引的特性:
 
5.1  对于那些在查询中很少使用或者参考的列不应该创建索引。
        这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。
        相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

5.2  对于那些只有很少数据值的列也不应该增加索引。
       这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,
       即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。

5.3  对于那些定义为blob数据类型的列不应该增加索引。
        这是因为,这些列的数据量要么相当大,要么取值很少。

5.3  当修改性能远远大于检索性能时,不应该创建索引。
       这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。
       当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

5.4  含有Null值的列,不应该建立索引。
    


    
    
6. 限制索引(索引失效)的因素有:
6.1  使用不等于操作符(<>、!=)
         下面的查询即使在cust_rating列有一个索引,查询语句仍然执行一次全表扫描。
         select cust_Id,cust_name from customers where  cust_rating <> 'aa';       

       把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。       
       select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';

   特别注意:通过把不等于操作符改成OR条件,就可以使用索引,以避免全表扫描。
 
6.2   使用IS NULL 或IS NOT NULL
        使用IS NULL 或IS NOT NULL同样会限制索引的使用,因为NULL值并没有被定义。
        在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成NOT NULL。
        如果被索引的列在某些行中存在NULL值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
    
6.3   使用函数
          如果不使用基于函数的索引,那么在SQL语句的WHERE子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
          下面的查询不会使用索引(只要它不是基于函数的索引)
        
        select empno,ename,deptno from emp  where  trunc(hiredate)='01-MAY-81';

        把上面的语句改成下面的语句,这样就可以通过索引进行查找。
        select empno,ename,deptno from emp where  hiredate<(to_date('01-MAY-81')+0.9999);
    
6.4   比较不匹配的数据类型
         也是比较难于发现的性能问题之一, 注意下面查询的例子,account_number是一个VARCHAR2类型,在account_number字段上有索引。

        下面的语句将执行全表扫描:
        select bank_name,address,city,state,zip from banks where account_number = 990354;
        Oracle可以自动把where子句变成to_number(account_number)=990354,这样就限制了索引的使用,改成下面的查询就可以使用索引:
        select bank_name,address,city,state,zip from banks where account_number ='990354';
 
        特别注意:不匹配的数据类型之间比较会让Oracle自动限制索引的使用, 即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”
        
6.5   对索引列进行运算
         使用函数,类型不匹配,对索引列进行各类运算,都会导致索引失效。
        
6.6   当使用LIKE关键字时,LIKE ‘%——’ 百分号在前面的,索引也会失效
6.7      单独的  >,  <   >=,  <=  如果查询数据超出30%,  索引也会失效.


7.  选用适合的Oracle优化器

    1.  Oracle的优化器共有3种:
        a. RULE (基于规则)
        b. COST (基于成本)
        c. CHOOSE (选择性)。    
        
        
        
        
本文参考以下内容: http://www.2cto.com/database/201110/107271.html       

原文地址:https://www.cnblogs.com/dragonflyyi/p/3716078.html