Catch Mechanize 404 => net::HTTPNotFound



我写了一个简单的函数来处理网址的获取:

def tender_page_get url, agent
  sleep(rand(6)+2)
  begin
    return agent.get(url).parser
  rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
    EYE.debug "--winter sleep #{url}"
    puts "-x-#{url}"
    sleep(300)
    tender_page_get url, agent
  rescue => e
    puts "-x-#{url}"
    EYE.debug "--unknown exception"
    EYE.debug "#{url} #{e.inspect}"
  end
end

问题是,即使我在第一个救援块中捕获了Net::HTTPNotFound,我仍然在我的日志记录中看到如下:

--unknown exception
{url} 404 => Net::HTTPNotFound

这意味着此异常被第二个救援块捕获。可能是什么原因呢?

Mechanize

为 404 而不是 Net::HTTPNotFound 引发 Mechanize::ResponseCodeError。Mechanize::ResponseCodeError 上的to_s如下所示:

def to_s
  "#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end

这将返回'404 => Net::HTTPNotFound',这使得它看起来像是引发的异常。

相关内容

  • 没有找到相关文章

最新更新