elasticsearch 原理小记

 
一。索引
term Index  trie 树  
二。压缩
term index压缩树 fst 形式、
dictionary 索引  Frame Of Reference 压缩posting list
skip list 压缩  Frame Of Reference  压缩差值
bitset 压缩 压缩相同值,并标识重复次数
文档数压缩,nest docment 嵌套文档,提取公共字段,减少文档数
三。合并
skip list 合并  减少重复完整的遍历整棵树
bitset合并
 四。同步
primary节点先写Lucene 内存,在写translog,先写Lucene是因为Lucene有检查,可能会失败,在写segment,translog是 顺序写,写入比segment随机写高,也方便使用translog进行同步。
原文地址:https://www.cnblogs.com/wanglao/p/11162478.html