我写了一个简单的函数来处理网址的获取:
def tender_page_get url, agent
sleep(rand(6)+2)
begin
return agent.get(url).parser
rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
EYE.debug "--winter sleep #{url}"
puts "-x-#{url}"
sleep(300)
tender_page_get url, agent
rescue => e
puts "-x-#{url}"
EYE.debug "--unknown exception"
EYE.debug "#{url} #{e.inspect}"
end
end
问题是,即使我在第一个救援块中捕获了Net::HTTPNotFound
,我仍然在我的日志记录中看到如下:
--unknown exception
{url} 404 => Net::HTTPNotFound
这意味着此异常被第二个救援块捕获。可能是什么原因呢?
Mechanize
为 404 而不是 Net::HTTPNotFound 引发 Mechanize::ResponseCodeError。Mechanize::ResponseCodeError 上的to_s如下所示:
def to_s
"#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end
这将返回'404 => Net::HTTPNotFound',这使得它看起来像是引发的异常。