信息检索(1)——常用5种方法

源课程网址:https://www.icourse163.org/learn/WHU-29001?tid=1206771226#/learn/content,本文中部分图片来源于视频截图,文字来源于

5基本方法

    • 大纲
    • 1.布尔逻辑检索
      • 逻辑与,AND,*,&
      • 逻辑或,OR,+,|
      • 逻辑非,NOT,AND NOT,-,!
      • 顺序:NOT AND OR
      • 火狐浏览器对逻辑非支持不好!
    • 2.位置限制
      • PRE/0,P/0,With:顺序不能颠倒,中间不能插入其他词(空格等不考虑);
      • PRE/#,P/#,With#:P/3,顺序不能颠倒,中间能插入3个词;
      • NEAR/0,N/0,Near(N):顺序可颠倒;
      • NEAR/#,N/#:顺序可颠倒,中间能插入#个词;
      •  
    • 3.短语(精确)检索
      • 加双引号
      • 专有名词
    • 4.截词检索(宽容的检索)
      • 截词符:* ,?;以OneLook搜单词为例
      • 前截词,*,*ology,
      • 中间截词,?,a?p
      • 后截词,*,tech*
      • *toxic*
      • *号(代表多个字符)和?号(一个字符)
    • 5.字段检索
      • 用途
        • title(ti,ti=,/ti),标题
      • 案例分析
        • “Information retrival”/TI,最准确,结果最少
        • Information AND retrival /TI
        • Information (F) retrival,结果最多
    • 6.区分大小写
      • 首字母大小写不同,意义不同
        • China,chian
        • Windows ,
        • Apple,apple
      • 用途
        • 图书馆,馆藏目录
        • metacrawler
    • 7.综合
      • 同义词,近义词;
      • 构造检索式
      • 英语较为复杂,因为因为英文里后缀不同,意义不同;
      • 一些关键词
        • 1、“site”表示搜索结果局限于某个具体网站或者网站频道,
        • 2、“link”语法返回所有链接到某个URL地址的网页。
        • 3、“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
        • 4、“allinurl”语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
        • 5、related用来搜索结构内容方面相似的网页。
        • 6、cache用来搜索GOOGLE服务器上某页面的缓存,功能同“网页快照”
        • 7、info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
      • 总结:在不同的浏览器,数据库中,具体使用方法不同!
原文地址:https://www.cnblogs.com/kekefu/p/12514122.html