如何在python中使用链表抓取站点时保持循环



我正在抓取一个网站,那里有链接,这些链接有孩子和他们的孩子衍生自己的孩子。这些孩子还会生出自己的孩子。我希望我的代码保持在循环中。然后在a中找到链接,然后将它们存储在列表中,跟踪孩子,抓取详细信息,然后继续到最后。然后从b开始,跟着一代又一代的孩子和他们的孩子。然后继续到c做同样的事情。我的问题是如何在python中做这样的事情,同时保持在循环中。如果有人遇到这样的问题,请帮助建议你如何去做,什么是最好的策略。

parents = [a, b, c]

a_children = [e, f, g]
e_children =  [h, j, k]
f_children = [l, m, n]
g_children = [o, p, q]
h_children = [r, s, t]

我想让这个函数循环运行到结束

def scrape_save_and_continue(driver, nodes):
print('Scraping Saving & Continuing..')
time.sleep(2)
print('Continuing ...')

提前谢谢你

在python中这都是关于缩进的。如果执行for循环,它将完成缩进中的所有内容,然后继续执行列表/范围中的下一个元素。

example_list = [a, b, c]
for letter in example_list:
for _ in range(0, 2):
print(letter)

由于缩进,这将打印:

b

b

c

c

最新更新