获取维基百科中任意语言中某个单词的所有含义



我想获得一个单词在维基百科上所有含义的列表。例如,对于单词"bar",消除歧义的方法列在http://en.wikipedia.org/wiki/Bar_(disambiguation):

  • 栏(建立)
  • <
  • 甜点酒吧/gh>

是否有办法从维基百科API访问来自不同语言的单词消歧?

对于英文来说,我认为网址的格式大部分是如上所述的(在标题中消除歧义)。但对于西班牙语或其他语言,消歧页面的url是不同的。

我试着看类别页面,它列出了所有消歧页面(例如。http://en.wikipedia.org/w/index.php?title=Category:All_article_disambiguation_pages&pagefrom=a),但它不直接列出术语的所有消歧。

Most (all?)维基百科版本现在安装了消歧器扩展,这意味着您可以从API访问所有消歧页面:

,,,,api.php?action=query&list=querypage&qppage=DisambiguationPages

然而,像维基百科这样的WMF wiki,你可以通过这种方式检索的结果数量是有限制的,所以如果你需要所有的结果,你必须下载一个数据库转储并对它进行查询(在这种情况下,你可以在page_props表上读一点,并对它进行SQL查询)。

第二种方法是使用WikiData,并查询(P31) Wikimedia消歧页面(Q4167410)实例的所有页面。

相关内容

  • 没有找到相关文章

最新更新