使用GitHub(HoopR(的软件包,我试图登录到一个网站以便进行抓取,但由于某种原因,我遇到了一个Forbidden(HTTP 403(错误。登录功能是HoopR软件包的一部分。我的代码以前运行得很好,所以我不确定出了什么问题。。。这对我来说是个新错误。
login(user_email = Sys.getenv("KP_USER"), user_pw = Sys.getenv("KP_PW")) #Uses HoopR package to log into Kenpom
我收到这个错误:
Error in read_html.response(x$response, ..., base_url = x$url) :
Forbidden (HTTP 403).
我已经尝试通过用以下代码设置我的用户代理来纠正这个错误,但仍然没有运气
require(httr)
headers = c(
`user-agent` = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'
)
res <- httr::GET(url = 'https://kenpom.com/index.php', httr::add_headers(.headers=headers))
我希望这不是一个愚蠢的问题,但我想知道是否有人能提供帮助或采取其他措施来度过难关。我整个学期都在为一个本科生班使用这个软件包,所以我有点不顾一切地想要克服这个障碍。非常感谢。
已解决***
老实说,我不知道是什么修复了它,但我重新安装了R和Rstudio,更新了我的macOS,并将我的登录信息更新到了我试图从中抓取的网站。这个问题可能太小众了,其他人都无法从中获得价值,但我想我会把它放在这里以防万一。