我有一个python脚本来对给定的一组excel文件进行数据分析。现在,我们正试图通过定期在mediawiki服务器上搜索最近上传的excel文件并应用我的脚本来自动执行这一步骤。
我们正在尝试看看是否有任何方法可以至少获得excel文件的url。
有人能帮我们吗?
要从2021年4月4日午夜起以XML格式向英文维基百科上传多达100次,请发送https://en.wikipedia.org/w/api.php?action=query&list=logevents&leaction=upload/upload&lestart=2021-04-04T00:00:00Z&lelimit=100&format=xml
。
要提取以.xls
或.xlsx
结尾的上载文件的名称,请使用XPath 1查询(//item[ends-with(@title,'.xls')] | //item[ends-with(@title,'.xlsx')])/@title
。
要从图像页面的名称中获取实际的图像URL,请使用https://en.wikipedia.org/w/api.php?action=query&titles=File:Limbo Royal Blood.jpg|File:Photo of Miriam Roth.jpg&prop=imageinfo&iilimit=100&iiprop=url
并应用XPath//imageinfo/ii/@url
。
请参阅https://www.mediawiki.org/wiki/API:Logevents.