MSSCrawlUrl

这张表保存了在索引(Index)中的所有的item的一份列表. 当我们说起爬网的"历史"的时候, 这就是我们所涉及的东西.

AccessUrl列, 保存了被发送到protocol handler中取回item的URL.

DisplayUrl 列, 是供爬网日志的Object Model使用的.

ParentDocId列, 其中保存的是一份docid.

其他比较重要的列有CrawlId , CommitCrawlId , ErrorId , ErrorDesc , ErrorLevel , TransactionFlags.

这张表如果很大, 也不允许用户手动的删除的, 否则会引起搜索的问题.

原文地址:https://www.cnblogs.com/awpatp/p/1650661.html