我试图使用R(package rvest)抓取此页面的HTML,但收到了"客户端错误416:请求的范围不满足"
经过长时间的搜寻,我似乎找不到解决办法。它在尝试使用rvest的html函数时抛出错误,该函数解析html页面:
url <- "http://shop.tcgplayer.com/magic/onslaught/polluted-delta"
html(url)
我使用的是R版本3.2.0。
任何帮助都将不胜感激!
您非常接近,只需使用现在更新的read_html
:继续从url
中提取即可
> read_html(url) %>%
+ html_nodes("table") %>%
+ html_text() %>%
+ .[[1]]
[1] "rn Rarity:rn Rrn Card Type:rn Land rn Description:rn Tap, Pay 1 life, Sacrifice Polluted Delta: Search your library for an island or swamp card and put it into play. Then shuffle your library.rnrn rn "