python中没有任何ID或类属性的美丽的解析表

我正在尝试使用美丽的小组来解析下面URL中表中的数据，

http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch

由于表没有类属性或ID，因此我无法使用soup.find的正常方法("表"，{" title"：" thetitle"}(来找到表。相反，我尝试了

warrantUrl = 'http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch'
warrantPage = urlopen(warrantUrl)
soup = BeautifulSoup(warrantPage, 'html.parser')
table = soup.find_all("tr")
paragraphs = []
for x in table:
    paragraphs.append(str(x))

另外，我尝试了这篇文章中提到的方法，与美丽的python解析桌子。但是没有成功...

该网站使用JavaScript，Beautifutsoup无法将其转换为HTML，它无法处理它，urllib也不能，您需要查看python的幽灵。

http://jeanphix.me/ghost.py/

阅读文档，它非常简单，强大且与请求相似。它具有"评估" JavaScript并以各种方式返回其值的能力。

相关内容

最新更新

热门标签：