我知道你可以从维基百科的数据库转储中获取所有标题,你可以查询特定的标题,但你如何通过MediaWiki API获取所有标题?
为此,您将使用Allpages API:
https://en.wikipedia.org/w/api.php?action=query&format=json&list=allpages&aplimit=max
你不会一次得到所有,但一次最多可以得到500个,然后是一个可以用于下一批标题的连续标记。继续执行此操作,直到JSON的答案开头没有query-continue
为止。