Clucene系列3--Clucene的代码组织结构

Clucene系列(3)——Clucene的代码组织结构

analysis

模块主要负责词法分析及语言处理，从而生成Term。也包括各种分析器

config

各种编译配置选项，以及一些与OS平台相关的内容。

debug

各种断言异常处理宏定义，错误常量。还自带一个内存泄漏跟踪工具和内存池

document

一个document对象就是用户提供的一篇文档，可以包括多个Field

index

模块主要负责索引的创建，如何读取索引，重要的类里IndexWriter，DocumentWriter,IndexReader,SegmentMerger,SegmentReader.
IndexWriter和DocumentWriter：负责创建索引
SegmentReader和IndexReader：负责读取索引
Segmentmerger：负责索引的合并

queryparser

Lucene自带的查询引擎。负责解析用户的输入，可以通过扫描用户输入的字符串，生成各种Query对象。Clucene中支持模糊查询，语义查询，短语查询，组合查询等等,如有TermQuery,BooleanQuery,RangeQuery,WildcardQuery等。

模块主要负责对索引的搜索,打分，和排序。

Store

主要负责对索引的存储。FSDirectory和RAMDistory是两个重要的类，一个实现了对磁盘的跨平台读写，另一个是把内存当成磁盘。

util

一些常用的工具类。主要有：
BitVector:位数组
PriorityQueue:优先级队列，好多地方都用到此结构。
VoidList和VoidMap:分别继承自STL的list 和map。
聪明的狐狸