小贝子编程

我如何在HTML中刮没有样式的文本

本文关键字：样式文本 HTML ruby nokogiri
更新时间 : 2023-08-25
英文 : How do I scrape text with no style in HTML?

我正在尝试抓取一个没有CSS的时间戳值:

<a href="famg.xml">famg.xml</a>              05-Sep-2012 22:21   32M   
<a href="file.203.xml">file.203.xml</a>      12-Apr-2013 21:02   11K   
<a href="file.202.xml">file.202.xml</a>      13-Apr-2013 16:08  1.7K   
<a href="file.201.xml">file.201.xml</a>      14-Apr-2013 16:14  1.8K   
<a href="file.212.xml">file.212.xml</a>      16-Apr-2013 09:02  1.1K

如果我使用doc.css('a')，我得到了所有<a>元素，但是当我查看时间戳值时，它在<a>之外，并且没有与之相关的CSS。

我想读取每个文件名和它的时间戳，并确保它是否是今天生成的

您可以在您选择的每个'a'元素上使用next_sibling.text。

doc.css('a').each { |x|
  puts x.next_sibling.text
}

我如何在HTML中刮没有样式的文本

相关内容

最新更新

热门标签：