SQL Server 哈希索引

转载自：https://blog.csdn.net/josjiang1/article/details/80637076

————————总结————————

使用场景：

1，当表中一个字段过长时，建立索引就不适合的了，建立索引的一个原则就是索引不能太宽。

2，对于varchar(max)、nvarchar(max) 和 varbinary(max) 大值数据类型根本就不能建立索引。

--（@URL nvarchar(500) 无法创建索引）--
SELECT * FROM tablename WHERE URL = @URL

定义：

返回按照表的某一行或一组表达式计算出来的校验和值。CHECKSUM 用于生成哈希索引。使用 CHECKSUM 生成哈希索引，通过将校验和列添加到索引的表中，然后对校验和列生成索引来生成哈希索引，尤其是当要索引的列为较长的字符列时可以提高索引速度。

步骤：

1- 为表的URL列添加校验和，并将其作为一列（csURL）加入该表：

alter table tablename add csURL as CHECKSUM(URL)

2- 为校验和列添加索引：

CREATE INDEX URL_index ON tablename (csURL);

3- 使用索引进行查询：

SELECT * FROM tablename WHERE csURL =CHECKSUM(@URL)

不支持类型：

CHECKSUM函数无法应用于如下非可比数据类型： text、ntext、image 和 cursor。

————————详细介绍————————

哈希索引（hash index）基于哈希表实现，只有精确匹配索引所有列的查询才有效。对于每一行数据，存储引擎都会对所有的索引列计算一个哈希码（hash code），哈希码是一个较小的值，并且不同键值的行计算出来的哈希码也不一样。哈希索引将所有的哈希码存储在索引中，同时在哈希表中保存指向每个数据行的指针。

对于hash相同的，采用链表的方式解决冲突。类似于hashmap。因为索引的结构是十分紧凑的，所以hash索引的查询很快。

举例：

hash索引的限制：

哈希索引只包含哈希值和行指针，而不存储字段值，所以不能使用索引中的值来避免读取行。
哈希索引数据并不是按照索引值顺序存储的，所以也就无法用于排序。
哈希索引也不支持部分索引列匹配查找，因为哈希索引始终是使用索引列的全部内容来计算哈希值的。
哈希索引只支持等值比较查询，包括=、IN()、<>（注意<>和<=>是不同的操作）。也不支持任何范围查询，例如WHERE price>100。
访问哈希索引的数据非常快，除非有很多哈希冲突（不同的索引列值却有相同的哈希值）。当出现哈希冲突的时候，存储引擎必须遍历链表中所有的行指针，逐行进行比较，直到找到所有符合条件的行。
如果哈希冲突很多的话，一些索引维护操作的代价也会很高。例如，如果在某个选择性很低（哈希冲突很多）的列上建立哈希索引，那么当从表中删除一行时，存储引擎需要遍历对应哈希值的链表中的每一行，找到并删除对应行的引用，冲突越多，代价越大。
---------------------
作者：简之
来源：CSDN
原文：https://blog.csdn.net/olizxq/article/details/82313489
版权声明：本文为博主原创文章，转载请附上博文链接！