返回的 Web 抓取元素不是我要查找的值



使用硒和phantomJS,我正在尝试从这个赛马统计网站上抓取曲目名称。我似乎无法在我正在寻找的元素中获得实际名称。任何帮助将不胜感激。

site = "https://www.drf.com/live_odds"
driver = webdriver.PhantomJS(my_directory)
driver.get(site)
trackname = driver.find_elements_by_xpath('//span[@class="titleTrack"]')
num_of_tracks = len(trackname)
print(num_of_tracks)
for i in range(num_of_tracks):
    print(trackname[i])
driver.close()

返回以下内容:

<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345793")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345794")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345795")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345796")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345797")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345798")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345799")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345800")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345801")>
<selenium.webdriver.remote.webelement.WebElement (session="4286dc50-aa79-11e9-80c7-21f36addf5ef", element=":wdc:1563577345802")>
其中 10 个

,我认为是那里的 10 个曲目名称。

您已经找到了 Web 元素。 现在,您需要从这些元素中获取文本。 试试这个:

for i in range(num_of_tracks):
    print(trackname[i].text)
<span class="titleTrack">
    <a href="/live_odds/winodds/track/AUS-AUC/AUS/5/D">AUS-Flemington</a>
</span>

标题包含在<a>标签中。 所以我尝试了 xPATH 和 '//span[@class="titleTrack"]/a'

然后文本值访问element.text

for i in range(num_of_tracks):
    print(trackname[i].text)

最新更新