BeautifulSoup:打开本地和HTTP HTML文件



我不能同时工作,只有一个或另一个:

link = open(url)
soup = BeautifulSoup(link.read(), "html.parser")

^与本地文件一起使用

link = urlopen(url).read()    
soup = BeautifulSoup(link, "html.parser")

^与http://(Internet(链接

一起使用

我如何简单地工作?

以您本地文件的方式是什么格式?您可以简单地检查输入字符串是否为URL:

if url.startswith('http'):
    link = urlopen(url).read()
else:
    link = open(url)

否则,只需将本地文件的路径转换为文件URI方案,您应该能够像常规URL

一样打开它们

最新更新