我想从多个URL中提取数据,但这些URL位于数据帧的一列中。
我尝试使用下面的代码进行数据提取,但没有成功。
from urllib.request import urlopen,Request
link = data.column1
f = urlopen(link)
myfile = f.read()
print(myfile)
它显示:
AttributeError:"Series"对象没有属性"type"。
请帮助编写代码。谢谢
问题是您试图同时对整个URL系列执行操作。
尝试迭代data.column1
的项目,不要忘记使用with
处理资源,以防止潜在的内存泄漏:
from urllib.request import urlopen
for link in data['column1']:
with urlopen(link) as response:
myfile = response.read()
print(myfile)