使用Wikipedia API在一定时间范围内获取最多的文章



给出了一些整数n和一个日期d,我想使用wikipedia api在d和当前日期之间获得n最查看的文章。这是可能的,如果是这样,如何?

我到目前为止尝试的是以下内容:

  1. 使用https://wikimedia.org/api/rest_v1/metrics/pageviews/top/en.wikipedia/all-access/2017/05/01。这种方法的问题首先,这似乎不支持n = 1000,其次,它仅在一天中汇总视图,而不是任意时间范围。

  2. 使用列表 allpages(即https://en.wikipedia.org/w/api.php?action=query&Amp; format=json& list = allpages(来获取所有文章,但是我不知道如何过滤结果,以使仅包括最多的文章。

我还检查了https://stats.wikimedia.org/,但没有找到任何有用的东西。

目前似乎无法通过pageViews API获得此功能。您可以在给定的一天或给定的一个月中找到最观看的文章,但在任意时间范围内找不到。有关可用的不同选项,请参见REST API文档,还请参见Wikitech上的PageViews API页面,该页面为在给定月份中查找最多的文章提供了一个示例。(有些令人担忧的是,在API文档页面上似乎没有记录到最观看的每个细分 - 每月语法。(

您也可以通过the Action API(API.PHP(获取页面浏览量数据,如TGR在下面的评论中所说,但数据与REST API相同。

您可能需要在Wikitech-L电子邮件列表上询问,该列表由Wikimedia Devs观看。他们将能够告诉您是否可能有不同的方式,如果没有,为什么该功能不可用。

最新更新