SharePoint Enterprise Search基础知识点拾遗系列之二

三种Gatherer Projects

==================

Main Gatherer Project(Portal_Content)

------------

Portal_Content 是主要的gatherer project. 当我们为Protal_Content爬内容的时候, 我们把元数据(metadata)放在property store中, 也就是在Search DB中. 我们把全文索引放入文件系统中, 为Portal Content存储内容. 简单来说, 就是被搜索文件的属性在search db中, 被搜索文件的内容在文件系统的索引文件中.

Anchor Project

-------------

Anchor Project把Search DB中的anchor表中的内容取出来, 然后填充至另一个全文索引中, 即Anchor index. 我们还向其中填充统计信息. 都做好了之后, 会把Anchor Index整合进主要的catelog index中.

Profile Import Project

-------------

第三种是Profile Import Project. 这个project跟搜索引擎没啥关系. 它跟profile的存储有关系. 它就是我们获取目录服务(比如Active Directory)中的用户信息后, 去掉多余的信息, 然后创建一种内部结构并存储在SSP DB的地方. 它的处理过程与爬一个文档的过程非常相似. 处理过的数据会被MySite, User Profile使用.  Profile Import也能像搜索一样的配置schedule. 把这个project放入search service要比单独再写一个service要容易, 所以要想让User Profile可以正常工作, Search必须正常.

原文地址:https://www.cnblogs.com/awpatp/p/1895194.html