我正在尝试循环浏览一个列表,在该列表中,当您选择要寻找的内容时,我试图刮擦的网站URL。一个例子是" buyhere.com",当我在网页上选择牛奶时,URL会更改为" buyhere.com/milk"。
如此有效,我试图通过Chromedriver进行价格检查Websraper的价格,在这种情况下,我可以将我设置的杂货项目列表列出,在这种情况下:
groceries = ['milk', 'bread', 'coffee', 'cereal', 'flowers']
for k in groceries:
url = 'https://buyhere.com/' + groceries
现在,当我投入一个项目时,我能够获取我正在寻找的信息(例如,价格,品牌(,但是当我尝试通过循环循环时,它给了我一些问题:
它将踢出无法将列表连接到str的错误。 我尝试了#groceries = str(['milk', 'bread', 'coffee', 'cereal', 'flowers'])
我尝试了#url = 'https://buyhere.com/' + str('groceries')
现在,当我运行它时,它基本上吐出了:
url = 'https://buyhere.com/[['milk', 'bread', 'coffee', 'cereal', 'flowers']
它不是拉动每个元素并循环遍历,而是在URL中打印我的整个列表。
我已经考虑过放置杂货[0],最后留下K = 1,但我也没有在那里受到任何关注。
from selenium import webdriver
import time
import pandas as pd
groceries = ['milk', 'bread', 'coffee', 'cereal', 'flowers']
for k in groceries:
url = 'https://buyhere.com/' + groceries
预期结果:
5循环,可在5种类型的杂货中拉数据
for k in groceries:
url = 'https://buyhere.com/milk
url = 'https://buyhere.com/bread
url = 'https://buyhere.com/coffee
etc
很乐意看看是否有人对如何解决。谢谢社区!
我认为您只是稍微弄乱了语法,尝试以下
from selenium import webdriver
import time
import pandas as pd
groceries = ['milk', 'bread', 'coffee', 'cereal', 'flowers']
for k in groceries:
url = 'https://buyhere.com/' + k
# do stuff with url ...