如何按贡献者解析维基百科谈话页面内容



我想解析维基百科对话页面(例如。,https://en.wikipedia.org/wiki/Talk:Elon_Musk)。我想循环浏览撰稿人/编辑的文本。不确定我该怎么做。目前,我有以下代码:

import pywikibot as pw
wikiPage="elon_musk"
page = pw.Page(pw.Site('en'), wikiPage)
talkpage = page.toggleTalkPage()
s=talkpage.text 
cs=talkpage.contributors()

似乎很难解析文本(即s(并找到每个参与者制作的谈话文本。不确定撰稿人的演讲从哪里开始和结束,以及什么演讲文本是对他人演讲文本的回应。有没有一种方法可以让谈话页面返回我可以循环浏览的片段?

非常感谢你的帮助!

我不知道pywikibot,但您可以通过普通的API来实现。这将获取修订:https://en.wikipedia.org/w/api.php?action=query&prop=修订&title=对话:Elon%20Musk&rvlimit=500&rvprop=时间戳|用户|评论|ids

然后,您可以传递修订ID以在每次编辑中获得更改:例如。https://en.wikipedia.org/w/api.php?action=compare&fromrev=944235185&torev=944237256

相关内容

  • 没有找到相关文章

最新更新