我目前正在学习网络抓取的Selenium。然而,我发现了定位以下属性的问题,并获得了属性的链接:
<a class="card cardListing" data-contentid href="/abc/def/gh.com"> == $0
我想得到"/abc/def/gh.com";在属性"out of the attribute"中;data contentid href"。我尝试过driver.find_elements_by_xpath("//*[@data-contentid href]")
,但被告知它是一个无效的选择器。
如果有人知道如何处理中间有空格的属性名称,你介意帮我弄清楚吗?
非常感谢。
首先是它的两个不同属性data-contentid
和href
。并获得href = "/abc/def/gh.com"
。你必须使用xpath
,如下所示-
请注意,在您的代码中,您使用的是find_elements
,而不是find_element
。find_elements
将返回元素的集合。
driver.find_elements_by_xpath("//a[@href='/abc/def/gh.com']")