我正在尝试使用Ruby mechanize抓取我的大学网站。这是我的红宝石脚本;
require 'mechanize'
agent = Mechanize.new
agent.get('https://kampus.izu.edu.tr')
此脚本不返回响应。我需要查看登录页面,但响应不同。我也像这样用 cURL 尝试过;
curl https://kampus.izu.edu.tr
这有效并返回登录页面。我错过了什么?
确保存储的是 agent.get(( 的输出。从您的示例中,我看不出您将如何使用/打印此请求的响应。
试试这个:
require 'mechanize'
agent = Mechanize.new
page = agent.get("https://kampus.izu.edu.tr")
puts page.body
.get(( 方法返回一个 Mechanize::P age 对象,您可以对其调用其他方法,例如 .css((,以通过 css 选择器选择元素。在此处查看文档