如何知道维基百科XML转储中的文章是否为列表



有一些指令可以判断文章是否是消歧页面。我想知道是否有任何指令/维基媒体模板用于将文章标记为列表?

到目前为止,我发现的唯一检查方法是通过Wikidata的P360属性,但理想情况下,我希望从Wikipedia XML转储中获得这些信息。

文章中没有这样的信息,但如果标题以"List of…"开头,则可以检查标题。

我不确定所有具有属性:P360的项目都是列表文章(例如,一些消除歧义的项目,如Q3086),但您可以通过MediaWiki API:访问它们

https://www.wikidata.org/w/api.php?action=query&list=backlinks&bltitle=Property:P360&blnamespace=0&bllimit=500

所有列表文章都以维基媒体列表文章(Q13406463)为例标记在维基数据中。您可以使用WikidataQuery API:获取所有这些信息

http://wdq.wmflabs.org/api?q=claim[31:13406463]

目前他们是216685(104843在enwiki)

你也可以用P360过滤所有没有歧义的项目:

http://wdq.wmflabs.org/api?q=claim[360] AND noclaim[31:4167410]

相关内容

  • 没有找到相关文章

最新更新