Lucene学习第一课

我读的关于lucene的第一篇文章是:《Lucene:基于Java的全文检索引擎简介》http://www.chedong.com/tech/lucene.html

这是一篇非常不错的文章,能让我们很快对lucene有一个很好的了解。

用最通俗的话来讲,lucene就是提供全文搜索功能的类库,所以我们还需要根据实际情况自行完成搜索程序的其他模块。越发的留有余地,越发的就有发展的空间。如中国的红楼一样。

lucene能够让我们不需要了解非常复杂的索引和搜索实现的情况下,通过调用它的一些简单API实现复杂的搜索功能。

lucene环境搭建的过程如下:

1、下载lucene3.0.3

地址:http://apache.mirror.phpchina.com/lucene/java/

2、下载jdk1.6

3、下载tomcat

下载以上内容完成后,开始安装。

1、安装jdk

一路确定下去,无需选择。

2、安装tomcat

一路确定下去,无需选择。

3、解压文件即可

假设解压文件路径为d:\lucene\

现在可以建立目录(此处的目录为我们要进行检索的信息的原始数据文件,我们放置在docs中,还有一个是lucene生成的检索信息,我们放置于index中),即可以在d:\lucene下建立一个temp\docs以及temp\index,此处两个文件夹目录可以随意,当然不一定非得放置于d:\lucene。

然后将需要检索的原始数据文件放置于docs文件夹中。

拷贝解压的lucene文件夹中的lucene-core-2.3.2.jar以及lucene-demos-2.3.2.jar到temp文件夹中,解压。

如果没有配置jdk环境,参考下方:

打开我的电脑-属性-高级-环境变量:

在系统变量中添加:

JAVA_HOME C:\Program Files\Java\jdk1.6.0

PATH %JAVA_HOME%\bin

CLASSPATH .;%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\jre\lib\rt.jar;

打开命令行:将目录定位到temp文件夹。

输入命令:

java org.apache.lucene.demo.IndexHTML -create -index D:\lucene\temp\index D:\lucene\temp\docs

即建立索引与原始数据文件的关系。

完成后,会发现index文件夹中多处一部分数据,以后再研究。

然后找到tomcat的安装目录,拷贝lucene中的luceneweb.war进入tomcat的webapps\文件夹中,启动tomcat,会看见webapps\下多出一个文件夹,找到configuration.jsp文件,将其中的String indexLocation = "/opt/lucene/index";修改为String indexLocation = "D:/lucene/temp/index";就是刚才生成的文件。

打开浏览器,输入http://localhost:8080/luceneweb/

输入需要查询的信息,看看结果如何。

简单地说:首先建立索引文件放置目录,cmd命令生成索引文件,部署工程,修改工程文件中目标为索引文件目录。

以上内容转自:http://gao-20022002.javaeye.com/blog/242740

自此之后就可以编写lucene的程序体验一下lucene带来的全新感受了。

原文地址:https://www.cnblogs.com/wrh526/p/2207783.html