r-不同操作系统/语言的汉字编码



我在r中读取包含简体中文的csv文件时遇到问题。我尝试了编码=utf-8、gb18130、gb2130等。无法显示中文。

我还尝试将excel的编码更改为utf8 csv,但没有成功
我也尝试使用中文窗口,并将区域设置设置为中国。运气不好。

之后我换成了中国窗户。excel可以打开我的csv(英文windows无法正确打开)。r工作室可以在View(),但R控制台无法读取我的csv,即使我将r重新安装为中文版本。

我试过Ubuntu,Ubuntu甚至根本读不懂我的csv。至少在Windows中,R工作室可以很好地读取我的数据。

我试过谷歌表单。但我的文件太大了,谷歌表单会甚至没有打开

我厌倦了Ubuntu中的Cals,并将其转换为GB*,因为GB是在WindowsR工作室工作良好。运气不好。它需要超过10分钟将我的200Mb-750Mb数据转换为gb18013

Ubuntu使用UTF-8作为默认的中文编码。因此,您应该将其编码为UTF-8,而不是GB18130或其他GB起始编码。

  • (1) 下载Open Office(免费快速安装,有更高版本文件大小比Ubuntu中的Cals大)。

  • (2) 检测您的CSV编码。只需使用open office打开您的csv,然后选择显示您的中文字符的编码方法。

  • (3) 根据您的操作系统。默认的Windows编码是中文的GBK,Ubuntu是UTF8。

这应该可以解决文件大小和编码问题。您甚至不必强制进行编码。正常的read.csv会起作用。

最新更新