用ruby从HTML元素中提取背景图像



我正在尝试使用Nokogiri从div中提取background-url,但无法解析它的background-url。

在搜索StackOverflow时,我发现了这个链接
解析:我可以在Nokogiri中获取嵌入CSS背景的URL吗?

Nokogiri不是网页浏览器。它建立在libxml2的基础之上,提供了快速而优秀的XML和HTML解析,以及从中操作和提取数据。

它只处理网页中的HTML。它不运行任何JavaScript。它不会对DOM应用CSS。没有办法使用Nokogiri来查找应用于元素的CSS样式,除非它直接在该元素的style="..."属性上。(即使这样,您也需要使用其他东西,如regex,来解析其中的CSS。)

如果你想处理一个网页并像浏览器一样对待它,你会想使用其他的东西,比如一个由Ruby控制的无头浏览器,例如Watir或Selenium。

相关内容

  • 没有找到相关文章

最新更新