我如何在HTML中刮没有样式的文本



我正在尝试抓取一个没有CSS的时间戳值:

<a href="famg.xml">famg.xml</a>              05-Sep-2012 22:21   32M   
<a href="file.203.xml">file.203.xml</a>      12-Apr-2013 21:02   11K   
<a href="file.202.xml">file.202.xml</a>      13-Apr-2013 16:08  1.7K   
<a href="file.201.xml">file.201.xml</a>      14-Apr-2013 16:14  1.8K   
<a href="file.212.xml">file.212.xml</a>      16-Apr-2013 09:02  1.1K

如果我使用doc.css('a'),我得到了所有<a>元素,但是当我查看时间戳值时,它在<a>之外,并且没有与之相关的CSS。

我想读取每个文件名和它的时间戳,并确保它是否是今天生成的

您可以在您选择的每个'a'元素上使用next_sibling.text

doc.css('a').each { |x|
  puts x.next_sibling.text
}

相关内容

  • 没有找到相关文章

最新更新