从各个站点搜索文件并列出它们



我想创建一个用于教育目的的文件搜索引擎。但我不知道怎么做。你能给我指正确的方向吗?我知道屏幕报废和api。我使用asp.net&c#用于编程。

例如,这个搜索引擎是如何搜索kohit.net和ectract链接的。Kohit不提供API或在url中使用参数。

基于您的示例,我认为

  1. 您可以从要扫描的每个搜索引擎中获取一个API,并使用该API使用您的搜索词对其执行搜索并显示结果
  2. 或者,如果无法使用API,您可以使用插入的搜索词(如http://search.ie/search.php?search=search+terms)访问他们的搜索url并解析结果,创建结果列表并将其显示给用户。这是两种方法中最不受欢迎的,因为它最有可能在目标搜索引擎代码的任何重组中失败

您可以使用诸如http://www.searchblox.com/它提供了内置的抓取机制和使用ApacheLucene/Solr的索引。使用其RESTful API与ASP.NET的集成也非常简单。

如果你想从头开始构建一个解决方案,你可能需要考虑一个蜘蛛网工具,并向Lucene/Solr或Sphinx等搜索平台写入内容,然后从你的应用程序中查询它们。使用SolrNet从ASP.NET查询Solr非常简单。

最新更新