简易的信息检索系统
项目概览:
本项目为 C++部分的课程考试题,需个人独立完成。
设计并实现一个简易的信息检索系统,构成搜索引擎的核心模块。该系统读取一组英文文本
文件,为该组文件创建反向索引(请参考“补充知识”部分),并借助创建好的反向索引实
现对文件内容的快速查询。
基本功能(必需):
1. 系统能够为一个文本文件集合创建反向索引。
2. 系统能够根据单个词语搜索相应的文件(例如“movie”、“good”)。
3. 系统提供基于命令行的用户交互界面,具体功能包括:
让用户指定需索引的文件目录(该目录包含需索引的全部文本文件);
让用户输入搜索内容;
显示搜索到的文件名(一个或多个)。
高级功能(可选):
1. 系统支持组合查询语句,该语句包含两个或多个以“OR”或“AND”连接的单词(例
如 “movie” AND “good”、“movie” OR “TV”)。系统无需支持同时包含“AND”和“OR”
的查询语句,例如(“good” OR “bad”) AND “movie”。
2. 系统支持短语(包含两个或多个单词)查询,例如“good movie”。
3. 系统能够对搜索到的文件与查询语句之间的关联度进行分析与排序,并按照关联度排序
(降序)显示搜索到的文件。
4. 系统能够支持一些更高级的用户交互功能(例如:系统在显示搜索结果时除了显示文件
名外,还显示文件内容,并将被查询的词汇以特殊的方式标出)。
5. 系统能够让用户指定一个需排除的词汇列表,这些词汇在创建反向索引时不被检索。
6. 其他能够提升索引与搜索质量的功能。专业程序代写c++程序代写