什么是全文检索

1、数据的分类
1)结构化数据
格式固定、长度固定、数据类型固定。
例如数据库中的数据
2)非结构化数据
word文档、pdf文档、邮件、html、txt
格式不固定、长度不固定、数据类型不固定。
2、数据的查询
1)结构化数据的查询
SQL语句,查询结构化数据的方法。简单、速度快。
2)非结构化数据的查询
从文本文件中找出包含spring单词的文件。
1、目测
2、使用程序吧文档读取到内存中,然后匹配字符串。顺序扫描。
3、把非结构化数据变成结构化数据
先跟根据空格进行字符串拆分,得到一个单词列表,基于单词列表创建一个索引。
然后查询索引,根据单词和文档的对应关系找到文档列表。这个过程叫做全文检索。

		索引:一个为了提高查询速度,创建某种数据结构的集合。

3、全文检索
先创建索引然后查询索引的过程叫做全文检索。
索引一次创建可以多次使用。表现为每次查询速度很快。

原文地址:https://www.cnblogs.com/yeyueweiliang/p/14115033.html