从存储在一列数据帧中的多个url中提取数据



我想从多个URL中提取数据,但这些URL位于数据帧的一列中。

我尝试使用下面的代码进行数据提取,但没有成功。

from urllib.request import urlopen,Request
link = data.column1
f = urlopen(link)
myfile = f.read()
print(myfile)

它显示:

AttributeError:"Series"对象没有属性"type"。

请帮助编写代码。谢谢

问题是您试图同时对整个URL系列执行操作。

尝试迭代data.column1的项目,不要忘记使用with处理资源,以防止潜在的内存泄漏:

from urllib.request import urlopen
for link in data['column1']:
with urlopen(link) as response:
myfile = response.read()
print(myfile)

相关内容

  • 没有找到相关文章