搜索引擎的核心原理-倒排索引

1:什么是正排索引?

  • 通过搜索 id 去查询内容属性,例如:查询id 12 对应的数据

2:什么是倒排索引?

  • 通过搜索属性值找到对应的id 查询出数据

3:正排索引的效率和倒排索引的效率?

  • 正排索引:假如现在有 100W 条数据 ,搜索出包含 邱健的内容,那么根据ID 一条一条的去查询其中是否包含 邱健 这个关键字
  • 倒排索引:假如现在有 100W 条数据 ,搜索出包含邱健的内容,那么会去单词库中查询出邱健这个单词,找到这个单词后,查询出单词映射包含到邱健内容的 ID

4:为什么用倒排索引而不采用正排索引?

  • 在搜索引擎中一切设计都是为了提高搜索的性能
原文地址:https://www.cnblogs.com/blogspring/p/14191750.html