小贝子编程

R 包 readHTML 中的抓取错误可获取:make.names 中的错误无效的多字节字符串

本文关键字：names make 错误多字节字符串无效 readHTML 抓取取错误获取 html r
更新时间 : 2023-08-30
英文 : Scraping error in R package readHTMLTable: Error in make.names invalid multibyte string

我正在尝试使用readHTMLTable从HTML网络获取一些数据。

网络上包含一些中文 utf-8 代码，所以它通常会给我一些错误。

第一次尝试：

u = "http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030"
url = htmlParse(u)
tbls = readHTMLTable(u,asText= TRUE)
dat <- data.frame(tbls)

错误：make.names 中的错误（vnames， unique = TRUE）：无效的多字节字符串 5

解决方案是将参数encoding = "UTF-8"添加到这些函数或连接中。更一般地说，在分析之前提供默认编码或挂钩可能是更可靠的解决方案。

url = htmlParse（baseURL， encoding="GB2312"）table=readHTMLTable（url，header=，which=1，encoding="UTF-8"）

相关内容