添加htmllagility Pack和Abot网络爬虫到项目



我使用"Abot" 1.2.3.1版本,但当我添加"Html Agility" 1.4.6.0版本到项目时,我得到这个错误:

Error 38 Assembly 'Abot, Version=1.2.3.1, Culture=neutral,PublicKeyToken=null' uses ' htmllagilitypack, Version=1.4.7.0,文化=中性,PublicKeyToken=bd319b19eaf3b43a'其中有更高的htmllagilitypack, version =1.4.6.0,文化=中立,都必须bd319b19eaf3b43a '

我知道这是旧的,但我刚刚遇到这个问题。也就是说,当我添加最新版本的HAP时,Abot无法工作。但是解决方法很简单,只需使用CSQueryHyperlinkParser来解析链接。像这样:

var crawler = new Abot.Crawler.PoliteWebCrawler(config, null, null, null, null, new Abot.Core.CSQueryHyperlinkParser(), null, null, null);

我的问题解决了

我从NuGet Before Abot安装了HtmlAgilityPack,问题解决了!

1-
PM> Install-Package HtmlAgilityPack
2-
PM> Install-Package Abot

Abot使用修补版本的html敏捷包,因为它会在某些类型的html页面上崩溃。请参阅此处记录的问题…

https://code.google.com/p/abot/issues/detail?id=77&能= 1,q = htmlagilitypack

在github上有一个问题来调查这是否仍然是html敏捷包的nuget版本的问题(我很确定有)。因此,直到nuget版本不会导致主机进程崩溃,Abot才会保留html敏捷包的补丁版本。

https://www.google.com/url?q=https%3A%2F%2Fgithub.com%2Fsjdirect%2Fabot%2Fissues%2F25& sa = D& sntz = 1, usg = AFQjCNEpS2q4AuuejXdc3F8P2cVB-VtSSQ

最新更新