优化/自定义Sharepoint搜索爬网

时间:2020-03-05 18:45:12  来源:igfitidea点击:

使用SharePoint Server 2007,还具有搜索功能和爬网程序。但是,Crawler在某种程度上受到限制,因为它仅在对外部站点进行爬网时才支持基本身份验证,并且无法告诉它忽略no-index,no-follow属性。

现在,有一个我想索引的站点,不幸的是,该站点使用它自己的身份验证系统,并且在页面上使用no-index,no-follow。当我控制该站点时,我可以删除属性,但这是PITA。此外,它不能解决身份验证问题。

所以我只是想知道是否有可能以某种方式扩展Sharepoint的Crawler?

解决方案

回答

MOSS SP1中应该已经解决了具有不同形式身份验证的MOSS爬网站点的限制。 :

http://www.microsoft.com/downloads/details.aspx?FamilyID=ad59175c-ad6a-4027-8c2f-db25322f791b&displaylang=en

这是指向文章的链接,该文章描述了如何获取SP1之前的MOSS修补程序以启用具有表单身份验证的网站爬网:

http://blogs.microsoft.co.il/blogs/adir_ron/archive/2007/10/11/moss-search-for-sso-form-b​​ased-authentication-sites.aspx

希望对我们有所帮助!