谷歌搜索API网站限制



根据Google自定义搜索API的文档:http://code.google.com/apis/customsearch/docs/start.html#sites你最多可以搜索5000个网站。这太差劲了。有没有办法绕过这个问题,让我可以使用谷歌的结果搜索整个网络?

此外,如果您包含一组匹配5000多个网站的url模式,API将如何选择要包含哪些网站和排除哪些网站?

这是用于自定义搜索,而不是普通的谷歌搜索。例如,如果您拥有abc.com和acme.com,您可以为客户在这两个域上设置自定义搜索。这样,他们就可以在你的网站上搜索信息。5000个站点的限制实际上是巨大的。我不确定我能想到一个应用程序会使用这么多指定的网站。

我想你正在寻找的是谷歌网络搜索API,它搜索了所有的谷歌。不幸的是,现在已经贬值了。(参考:http://code.google.com/apis/websearch/)你仍然可以使用旧的API,但这是一个风险,因为谷歌保留随时关闭它的权利。他们还会限制你每天执行的搜索次数(尽管我找不到这个限制的具体数字)。以下是他们条款的链接:http://code.google.com/apis/websearch/terms.html

如果您真的想将API直接集成到代码中,我建议您查看另一个搜索引擎的API。一个不同的建议是把你的搜索信息放在一个界面后面,现在把它编码到谷歌。然后,如果他们关闭它或出现更好的东西,你可以只更改搜索代码,指向最新和最好的API。

谷歌自定义搜索实际上能够搜索整个网页,尽管设置并不明显。请参阅"搜索整个网站"。

你可能遇到的其他问题有:

  1. 每次搜索只能得到100个结果,并且
  2. 您每天只能进行100次查询

遗憾的是,"升级"到谷歌网站搜索消除了第二个问题,而牺牲了搜索整个网站的能力。

如果您在自己的网站上托管链接的规范CSE文件,则可以突破5000的限制https://www.google.com/cse/docs/cref.html

最新更新