R 语言中文乱码问题

R 语言似乎在WINDOWS平台上对中文的支持不是特别好,似乎是3.1.2的一个BUG。

目前我研究出了一个临时解决方案,你可以将代码编写成一个函数,从而在调用的过程中不必如下繁琐:

1. 先将本地语言集转换成English 1252:

 Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")

2. 将文件集以UTF-8的格式读入:

b<-read.csv(y,head=F,encoding="UTF-8",stringsAsFactor=F)

3.最后将本地语言集再转换成中文。 

Sys.setlocale("LC_CTYPE", "Chinese")

 

 

值得注意的是上例中文件以UNICODE的字符集的形式存在,似乎对ANSI的字符集却不会有问题。我也闹不明白什么问题。

 

原文地址:https://www.cnblogs.com/kiddy/p/4350196.html