搜索引擎一:介绍

  搜索引擎是现在比较热的概念了,其实在国外,搜索引擎出现得挺早,90年就有MTV搜索,垂直搜索好像在93年就提出了。但在国内垂直搜索现在做得还比较一般。
  搜索引擎有几种,包括桌面搜索引擎,全文检索(Google),智能搜索引擎(ask.com)。桌面搜索引擎是搜索本机的文件,全文检索就不用说了吧?智能搜索能够输入一句话来搜索。
  搜索对象有基于内容和基于网站。
  我们公司就有在做垂直搜索引擎,根据定义,“垂直搜索是针对某一个行业的专业搜索引擎”,当然,我们是有多个行业的。但垂直搜索其实没有给搜索技术带来什么样的革新。最早是国外“比较购物”网站出现,引起大家的注意。中国以前也有出现一些垂直搜索,像一些网站提供“生活搜索”等。
  垂直搜索一些的流程是:

  垂直搜索对用户的感受要求更严格。现在搜索主要遇到几个问题:
  Deep Web (深网络),指很多页面不是一点开就存在的,需要输入关键词等进行搜索才出现。
  Page Information extraction(页面信息抽取)
  还有,数据爆炸,智能分析,与数据库结合(Oracle尝试过,效果好像不行)。
  列举一个相关的知识领域:
  1.信息检索
  2.信息抽取
  3.信息挖掘
  4.机器学习
  5.自然语言学习。
原文地址:https://www.cnblogs.com/fyan888/p/SearchEngine1.html