我想创建一个用于教育目的的文件搜索引擎。但我不知道怎么做。你能给我指正确的方向吗?我知道屏幕报废和api。我使用asp.net&c#用于编程。
例如,这个搜索引擎是如何搜索kohit.net和ectract链接的。Kohit不提供API或在url中使用参数。
基于您的示例,我认为
- 您可以从要扫描的每个搜索引擎中获取一个API,并使用该API使用您的搜索词对其执行搜索并显示结果
- 或者,如果无法使用API,您可以使用插入的搜索词(如
http://search.ie/search.php?search=search+terms
)访问他们的搜索url并解析结果,创建结果列表并将其显示给用户。这是两种方法中最不受欢迎的,因为它最有可能在目标搜索引擎代码的任何重组中失败
您可以使用诸如http://www.searchblox.com/它提供了内置的抓取机制和使用ApacheLucene/Solr的索引。使用其RESTful API与ASP.NET的集成也非常简单。
如果你想从头开始构建一个解决方案,你可能需要考虑一个蜘蛛网工具,并向Lucene/Solr或Sphinx等搜索平台写入内容,然后从你的应用程序中查询它们。使用SolrNet从ASP.NET查询Solr非常简单。