在python“找不到html5lib”中读取HTML到数据框的错误



在尝试读取HTML数据框时,我已经在html5lib上遇到以下错误。

这是代码:

!pip install html5lib
!pip install lxml
!pip install beautifulSoup4
import html5lib
import lxml
from bs4 import BeautifulSoup
table_list = pd.read_html("http://www.psmsl.org/data/obtaining/")

这是错误:

ImportError                               Traceback (most recent call last)
<ipython-input-68-e24654a0a301> in <module>()
----> 1 table_list = pd.read_html("http://www.psmsl.org/data/obtaining/")
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in read_html(io, match, flavor, header, index_col, skiprows, attrs, parse_dates, tupleize_cols, thousands, encoding, decimal, converters, na_values, keep_default_na)
    913                   thousands=thousands, attrs=attrs, encoding=encoding,
    914                   decimal=decimal, converters=converters, na_values=na_values,
--> 915                   keep_default_na=keep_default_na)
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in _parse(flavor, io, match, attrs, encoding, **kwargs)
    737     retained = None
    738     for flav in flavor:
--> 739         parser = _parser_dispatch(flav)
    740         p = parser(io, compiled_match, attrs, encoding)
    741 
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in _parser_dispatch(flavor)
    680     if flavor in ('bs4', 'html5lib'):
    681         if not _HAS_HTML5LIB:
--> 682             raise ImportError("html5lib not found, please install it")
    683         if not _HAS_BS4:
    684             raise ImportError(
ImportError: html5lib not found, please install it

任何帮助将不胜感激。谢谢

如果您读取错误消息,则未安装html5lib。做:

pip install html5lib

在您的终端中。


如果您是从Jupyter笔记本电脑打电话(就像您对!一样(,请尝试重新启动内核以加载软件包。

我在尝试使用Spyder IDE读取保存的.htm文件时出现了此确切的错误。

此代码显示HTML5LIB错误:

import pandas as pd
df = pd.read_html("F:xxxxxxxxxxxxxxaaaa.htm")

我知道我已经安装了html5lib并正常工作,因为我还有其他脚本。

无论出于何种原因,文件路径都需要是字符串字面(将R放在文件路径的前面(。

此代码对我有用:

import pandas as pd
df = pd.read_html(r"F:xxxxxxxxxxxxxxaaaa.htm")

我在试图打开的本地文件的错误路径时遇到了这个错误。因此,请确保您指向正确的位置!

最新更新