正在使用带有请求和lxml的xpath，但存在问题

当我使用xpath用lxml抓取数据时，我一直遇到问题。我想把dow的价格刮下来，但当我用python打印出来时，上面写着Element span在0x448d6c0。我知道这一定是一块记忆，但我只想知道价格。我如何打印价格而不是它在内存中的位置？

from lxml import html
import requests
page = requests.get('https://markets.businessinsider.com/index/realtime- 
chart/dow_jones')
content = html.fromstring(page.content)
#This will create a list of prices:
prices = content.xpath('//*[@id="site"]/div/div[3]/div/div[3]/div[2]/div/table/tbody/tr[1]/th[1]/div/div/div/span')
#This will create a list of volume:

print (prices)

您得到的生成器只是内存位置。要访问它们，您需要在它们上调用一个函数，在这种情况下，您希望文本为.text

此外，我强烈建议更改XPath，因为它是一个文字位置，可能会更改。

prices = content.xpath("//div[@id='site']//div[@class='price']//span[@class='push-data ']")
prices_holder = [i.text for i in prices]
prices_holder
['25,389.06',
'25,374.60',
'7,251.60',
'2,813.60',
'22,674.50',
'12,738.80',
'3,500.58',
'1.1669',
'111.7250',
'1.3119',
'1,219.58',
'15.43',
'6,162.55',
'67.55']

同样值得注意的是，您将只在加载时获得值。如果你想让价格随价格变化而变化，你可能需要使用硒。

变量prices是一个包含web元素的列表。您需要调用text方法来提取值。

print(prices[0].text)
'25,396.03'

相关内容

最新更新

热门标签：