es倒排索引原理解析

倒排索引原理

       

   

   普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容  如果用这样的方式查找   当需要查找某个单词的时候需要遍历所有的文档集合

   查找文档的效率会非常的慢

   2.基本倒排索引:

        在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储

        并且在最后一列保存这个被切分后的单词出现的文档编号的集合

   

      

    3.完善的倒排索引

    

分词原理

    1.写时分词

      

    2.读时分词

     

    

    es对文本内容进行分析的三个步骤   链式调用的形式来处理

   

         

文档路由原理

     

    

原文地址:https://www.cnblogs.com/yxh168/p/11386706.html