某些类不会在 Python 网页抓取中抓取



http://finance.daum.net/item/main.daum?code=052400

** 这是一个韩国金融门户网站,显示一家名为"Kona i"的韩国公司的股票信息

我是一个初学者,刚开始学习使用Python进行网络抓取。 我试图使用 BS 刮掉这只股票的价格。在网页中,股票价格的标签和类别分别是em,"curPrice up"。所以我在选择器部分放了"em.curPrice up"。当我打印它时,只是想出了一个空列表。它有什么问题?

price = requests.get("http://finance.daum.net/item/main.daum?code=052400")
html = bs(price.text, "lxml")
current_price = html.select("em.curPrice up")

你在html中寻找的元素似乎是这个。

<em class="curPrice up">19,450</em>

em.curPrice up的 html 选择器会将<em>与 curPrice 类匹配,然后查找子元素<up>

您应该修改选择器以em.curPrice.up

最新更新