r-不同操作系统/语言的汉字编码

我在r中读取包含简体中文的csv文件时遇到问题。我尝试了编码=utf-8、gb18130、gb2130等。无法显示中文。

我还尝试将excel的编码更改为utf8 csv，但没有成功
我也尝试使用中文窗口，并将区域设置设置为中国。运气不好。

之后我换成了中国窗户。excel可以打开我的csv（英文windows无法正确打开）。r工作室可以在View（），但R控制台无法读取我的csv，即使我将r重新安装为中文版本。

我试过Ubuntu，Ubuntu甚至根本读不懂我的csv。至少在Windows中，R工作室可以很好地读取我的数据。

我试过谷歌表单。但我的文件太大了，谷歌表单会甚至没有打开

我厌倦了Ubuntu中的Cals，并将其转换为GB*，因为GB是在WindowsR工作室工作良好。运气不好。它需要超过10分钟将我的200Mb-750Mb数据转换为gb18013

Ubuntu使用UTF-8作为默认的中文编码。因此，您应该将其编码为UTF-8，而不是GB18130或其他GB起始编码。

（1）下载Open Office（免费快速安装，有更高版本文件大小比Ubuntu中的Cals大）。
（2）检测您的CSV编码。只需使用open office打开您的csv，然后选择显示您的中文字符的编码方法。
（3）根据您的操作系统。默认的Windows编码是中文的GBK，Ubuntu是UTF8。

这应该可以解决文件大小和编码问题。您甚至不必强制进行编码。正常的read.csv会起作用。

相关内容

最新更新

热门标签：