如何在python中获取维基百科中某些页面的反向链接



我正在使用以下代码获取维基百科中页面的反向链接。

import pywikibot as pw
backlinks_list = []
for item_backlink in pw.Page(pw.Site('en', 'wikipedia'), wikipedia_name).backlinks():
backlinks_list.append(item_backlink.title())

然而,当我在代码中设置wikipedia_name = "Cyproheptadine"时,我会得到以下错误。

pywikibot.exceptions.CircularRedirect: Page [[en:Dibenzocycloheptene]] is a circular redirect.
CRITICAL: Exiting due to uncaught exception <class 'pywikibot.exceptions.CircularRedirect'>

我想知道为什么会发生这种情况,以及如何获得此类页面的反向链接?

如果需要,我很乐意提供更多细节。

默认情况下,.backlinks()包括重定向页面的反向链接。虽然这有时是一个所需的功能,但在您的情况下,它会导致错误。"二苯并环庚烯"是"赛庚啶"的反向链接,但"二苯苯并环庚烯"也是对"二苯并茂烯"的重定向,后者再次是对"二苯并环庚二烯"的重定向。这是一个圆圈,因此pywikibot抛出一个错误。

您可以通过设置.backlinks(follow_redirects=False)来解决此问题。然后重定向的反向链接将不会包含在您的列表中。

由于循环重定向非常罕见,你也可以从源头上解决这个问题:去维基百科,通过删除"Dibenzocycloheptene"上的重定向链接来剪切循环。

最新更新