Elasticsearch

结构化数据与非结构化数据

结构化数据是指具有固定格式或有限长度的数据,可以使用关系型数据库进行存储,可构建索引进行搜索。

非结构化数据即全文数据是指无固定格式的数据,如word、邮件等,对于非结构化数据即全文数据的搜索主要由两种方法:顺序搜索法和全文搜索法。

全文搜索的方法

全文搜索的主要由两种方法:顺序搜索法全文搜索法

顺序搜索法是根据关键字从头到尾读取一遍数据,然后标记关键字出现的位置。

全文搜索法:将非结构画的数据的部分数据提取出来,重新组织,使其变得有一定结构,然后对这些有一定结构的数据进行搜索,从而提高搜索效率,这种方式就是

全文搜索的方式。提取出来的这部分信息称之为索引

全文搜索引擎

全文搜索引擎是目前广泛应用的主流搜索引擎,它的工作原理是计算索引程序通过扫描文章中的每一个词,对每一个词建立索引,指明该词在文章中出现的次数和位置,当用户查询时,就根据之前建立的索引进行查询,经查询结果反馈给用户。常见的搜索引擎包括了:Lucene、solr以及elasticsearch。

ElasticSearch是什么?

Elasticsearch是一个开源,基于Apache Lucene库构建的Restful搜索引擎。

原文地址:https://www.cnblogs.com/menbo/p/13818026.html