Microsoft Web Ngram API可以处理多少请求量



我目前有一个200个单词的列表,我需要从中创建语义正确的排列。不幸的是,通过这种规模的列表进行排列将导致大约一万亿次的排列。

我计划做的是利用Microsoft Web Ngram服务和yield函数在我的排列中找到联合得分超过某个阈值的Ngram。我希望通过基于分数的过滤,我将只剩下语义正确的排列

我的问题是关于Microsoft Ngram API:有一个200个单词的列表,使用这种方法会有很多排列——有人能告诉我API函数是否能够处理这么多请求吗?

谢谢!

您可以进行的查询数量没有限制。然而,使用条款不允许线程访问,并且服务器响应相对较慢(每个查询在0.12到0.22s之间)。因此,您可以在24小时内获得最多720k个查询。我使用的是PHP的file_get_contents(…)。可能有一种更快的方法。

在我的应用程序中,我分割了一个库,以便根据需要使用n-gram数据更新部分。它确实减慢了我的代码,但它至少是站得住脚的。

http://kkava.com/vocab/?ngram=on&imp=on&v=

最新更新