我正在尝试使用readHTMLTable从HTML网络获取一些数据。
网络上包含一些中文 utf-8 代码,所以它通常会给我一些错误。
第一次尝试:
u = "http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030"
url = htmlParse(u)
tbls = readHTMLTable(u,asText= TRUE)
dat <- data.frame(tbls)
错误:make.names 中的错误(vnames, unique = TRUE):无效的多字节字符串 5
解决方案是将参数encoding = "UTF-8"
添加到这些函数或连接中。更一般地说,在分析之前提供默认编码或挂钩可能是更可靠的解决方案。
url = htmlParse(baseURL, encoding="GB2312")table=readHTMLTable(url,header=,which=1,encoding="UTF-8")