信息检索Reading List

信息检索Reading List - Searcher's Log

信息检索Reading List

 

/* -*- author: Tan Menglong; email: tanmenglong_at_gmail; twitter/weibo: @crackcell; 转载请注明出处 -*- */

1 WTF?

经理让我给一位新进入职的同学准备一些入职前的准备材料,考虑到后续会不断有新同学入职,就专门开一个帖子,整理下我觉得好的阅读材料。这里是假设读者为非信息检索相关学科的同学。 特别注意,我也是初学者,列出来也算是对自己的一个提醒。有啥意见建议或者推荐请留言告知,感激不尽。

2 信息检索相关

2.1 基础篇

2.1.1 《信息检索导论》

2.1.2 《深入搜索引擎》

2.1.3 《Hadoop in Action》

2.1.4 《机器学习》

2.1.5 《信息论基础》

2.1.6 论文

  • Page, Lawrence; Brin, Sergey; Motwani, Rajeev and Winograd, Terry (1999). The PageRank citation ranking: Bringing order to the Web.
  • Arvind, Arasu; Junghoo, Cho; Hector, Garcia-Molina; Andreas, Paepcke; Sriram Raghavan. Searching the Web
  • Monika, Henzinger. Link Analysis in Web Information Retrieval
  • Amit, Singhal. Modern Information Retrieval: A Brief Overview
  • Norbert, Fuhr. Probabilistic Models in Information Retrieval
  • ChengXiang, Zhai. Statistical Language Models for Information Retrieval A Critical Review

2.2 提高篇

2.2.1 《The Elements of Statistical Learning》

2.2.2 《统计学习理论的本质》

2.2.3 《Pattern Recognition and Machine Learning》

2.2.4 《Learning with Kernels》

2.3 可选

2.3.1 《Natural Language Processing with Python》

2.3.2 《Data Analysis with Open Source Tools》

2.3.3 《Mahout in Action》

2.3.4 《R in a Nutshell》

3 more else?

除了基础的东西,还可以额外关注一些ir、ml等领域顶级学术会议的文章。比如sigir、icml等。也可以多了解下ir领域比较新的一些研究领域,比如learning to rank啥的。

4 (未完待续⋯⋯)

Author: crackcell <tanmenglong AT gmail DOT com>

Date: 2012-03-19 14:56:04 CST

HTML generated by org-mode 6.33x in emacs 23

原文地址:https://www.cnblogs.com/lexus/p/2728151.html