网络抓取-Python:有正确的图片url,不能下载图片



我正在获取图像的正确url。但我似乎无法下载图像并将其保存到文件中。我是python的新手,所以任何指导都将不胜感激。我已经在其他几篇文章中尝试过了,一旦我得到url,下载图像就没有任何问题。我猜它不喜欢非洲司令部?

url: http://www.africom.mil/Newsroom/Article/12058/multinational-participation-plays-key-factor-to-exercise-african-lion
soup = BeautifulSoup(urllib2.urlopen(url).read())
links = soup.find("div", {'class': 'usafricom_ArticlePhotoContainer'}).find_all('img', src=True)
for link in links:
        imgfile = open('%s' % timestamp + "_" + title.encode("utf-8") + ".jpg", "wb")
        link = link["src"].split("src=")[-1]
        imgurl = "www.africom.mil" + link + ".jpg"
        download_img = urllib2.urlopen(imgurl).read()
        imgfile.write(download_img)
        imgfile.close()

我不确定您在代码中看到的错误是什么。你的问题没有提到错误。当我尝试你的代码时,我遇到了这个错误:

ValueError: unknown url type: www.africom.mil/Image/12059/High/030414-M-XI134-002.jpg

这个错误是因为你的代码中的这一行:

imgurl = "www.africom.mil" + link + ".jpg"

它没有指定http协议。更改为:

imgurl = "http://www.africom.mil" + link + ".jpg"

并检查。这一改变对我很有效。

最新更新