我对ruby很陌生。我知道如何读/写文件(或者我是这么想的),但我把nokogiri加入其中,这让我挠头。
require 'nokogiri'
require 'open-uri'
url = "URL"
page = Nokogiri::HTML(open(url))
crawl = page.css('.homehlcpm1 > div:nth-child(1) > ul:nth-child(2) > li:nth- child(1)','.homehlcpm1 > div:nth-child(1) > ul:nth-child(2) > li:nth-child(2)','.homehlcpm1 > div:nth-child(1) > ul:nth-child(2) > li:nth-child(3)').each do |el|
puts el.text
puts
end
所以,目前一切都在运转。现在,当我尝试使用"爬网"作为源编写文件时,我会得到一个空白文本文档。
open("crawling.text", "w"){ |file| file.write(crawl)}
如有任何帮助,我们将不胜感激。提前感谢!
如果您在Unix环境中运行脚本,您可以将脚本输出重定向到如下文件:
$ script_name.rb > crawling.txt
这样,脚本中的每个输出(p
、puts
、print
等)都将写入该文件中。请注意,这将用脚本的输出覆盖文件内容。如果您只想将输出附加到文件中,请使用以下命令:
$ script_name.rb >> crawling.txt