python中没有任何ID或类属性的美丽的解析表



我正在尝试使用美丽的小组来解析下面URL中表中的数据,

http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch

由于表没有类属性或ID,因此我无法使用soup.find的正常方法("表",{" title":" thetitle"}(来找到表。相反,我尝试了

warrantUrl = 'http://hk.warrants.com/home/en/sgdata/list_e.cgi#topsearch'
warrantPage = urlopen(warrantUrl)
soup = BeautifulSoup(warrantPage, 'html.parser')
table = soup.find_all("tr")
paragraphs = []
for x in table:
    paragraphs.append(str(x))

另外,我尝试了这篇文章中提到的方法,与美丽的python解析桌子。但是没有成功...

该网站使用JavaScript,Beautifutsoup无法将其转换为HTML,它无法处理它,urllib也不能,您需要查看python的幽灵。

http://jeanphix.me/ghost.py/

阅读文档,它非常简单,强大且与请求相似。它具有"评估" JavaScript并以各种方式返回其值的能力。

最新更新