其他

1. 概述

  1. 概述

    1. 简述 反向索引
    2. 也有人叫 倒排索引
  2. 场景

    1. 经常会出现在 搜索引擎 的后面

2. 生活中的索引

  1. 目录

    1. 格式

      # 章节内容在哪一页
      <content> -> <page>
      
    2. 字典

      # 单词在哪一页
      <word> -> <page>
      
  2. 思路

    1. 内容 在 哪个位置

3. 搜索引擎生成 倒排索引 的内容

  1. 英文 索引 生成
    1. 输入
      1. 文本
    2. 过滤
      1. 例如 html 标签
    3. 分词
      1. 时态
      2. 单复数
    4. 过滤
      1. 过滤一些没哈用的词
        1. 比如: a, an, the, this, that
    5. 输出
      1. 正向索引
    6. 生成 反向索引

4. 正向索引

  1. 概述

    1. 生成索引时第一轮的输出
  2. 名称由来

    1. 首先输出, 所以叫正向
      1.
    2. 反向索引
      1. 基于正向索引而来, 所以叫反向
      2. 其实就是普通的索引
        1. 标记 内容 在 某个位置
  3. 形式

    Doc1 -> the, cow, says, moo
    Doc2 -> the, cat, and, the, the, hat
    Doc3 -> the, dish, ran, away, with, the, spoon
    

5. 反向索引

  1. 概述

    1. 搜索引擎使用的最终结果
    2. 实际的思路, 就是 普通索引
      1. 就是 字典里那种
  2. 名称由来

    1. 正向索引
    2. 正向索引反过来
尽量尝试解释清楚; 自己校对能力有限, 如果有错误欢迎指出
原文地址:https://www.cnblogs.com/xy14/p/12015815.html