我试图获得一块HTML的src
值。我特别尝试使用at_css
来实现这一点,而不是使用XPath。
到目前为止,我得到的要么是nil,要么是空字符串。
这是HTML:
<div class="" id="imageProductContainer">
<a id="idLinkProductMainImage" href='URL'>
<img id="productMainImage" src="SRC.jpg" alt="alt" title="A Title" align="left" class="product_image_productpage_main selectorgadget_selected">
</a>
</div>
我的代码是:
item = page.doc.at_css("#productMainImage img").text.strip unless page.doc.at_css("#productMainImage img").nil?
puts item #prints blank
item = item["src"]
puts item #prints blank
其中page.doc
为Nokogiri HTML元素
如果您需要src
属性,您可以这样做:
pace.doc.at_css('#idLinkProductMainImage img').attr('src')
也,我认为问题是你得到img
标签的方式。您试图在#productMainImage
中获得所有img
标签,但此id
是图像本身,因此它将一无所获。
如果你使用链接id #idLinkProductMainImage
,那么你有一个img
标签来搜索它。