我正在尝试抓取一个没有CSS的时间戳值:
<a href="famg.xml">famg.xml</a> 05-Sep-2012 22:21 32M
<a href="file.203.xml">file.203.xml</a> 12-Apr-2013 21:02 11K
<a href="file.202.xml">file.202.xml</a> 13-Apr-2013 16:08 1.7K
<a href="file.201.xml">file.201.xml</a> 14-Apr-2013 16:14 1.8K
<a href="file.212.xml">file.212.xml</a> 16-Apr-2013 09:02 1.1K
如果我使用doc.css('a')
,我得到了所有<a>
元素,但是当我查看时间戳值时,它在<a>
之外,并且没有与之相关的CSS。
我想读取每个文件名和它的时间戳,并确保它是否是今天生成的
您可以在您选择的每个'a'
元素上使用next_sibling.text
。
doc.css('a').each { |x|
puts x.next_sibling.text
}