[ lucene FAQ ] 当磁盘索引被IndexSearcher打开时,为什么优化操作后索引容量翻倍?

lucene问题汇总:

Lucene常见问题汇总

当IndexSearcher打开一份磁盘索引后,IndexSearcher实例持有的是打开索引时的一份镜像索引,而执行优化动作后,将会把优化后的索引存储到原磁盘路径下,导致索引容量翻倍。

那么怎么解决这个问题呢?IndexSearcher实例执行re-open动作,然后再执行优化操作,此时的优化操作很快,相当于是删除之前IndexSearcher持有的镜像索引。

特别是在实时索引过程中,对大索引的优化一般比较耗时,因此合理的解决方案是:单独开一条线程执行优化操作,当优化完成后对IndexSearcher实例进行re-open操作,然后再执行一次优化操作。

在这一系列过程中,不会因为优化操作而对检索服务造成影响,也不会占用额外的磁盘空间(第二次优化的时候会将重复的索引文件进行删除,节约磁盘空间)。

但是必须注意的是:在第一优化操作时,必须保证空闲磁盘空间大于目前的索引容量。

原文地址:https://www.cnblogs.com/huangfox/p/1851186.html