使用海葵从网站获取URL列表时出错



代码:

require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.on_every_page do |page|
    puts page.url
  end
end

当我尝试这个代码时,我应该得到该网站上所有URL的列表,但我得到的只是网站的名称。可能的错误是什么?我如何获得所有URL的列表?

我想海葵就是不能遵循重定向或类似的东西,因为"http://example.com"在其他网站重定向我。你尝试过抓取其他网站吗?"?http://stackoverflow.com例如

相关内容

  • 没有找到相关文章

最新更新