我正在运行这样一系列命令:
read_csv = read.csv('D:/winequality-white.csv', stringsAsFactors=FALSE)
str(read_csv)
在我得到的结果中:
'data.frame': 4898 obs. of 1 variable:
$ fixed.acidity.volatile.acidity.citric.acid.residual.sugar.chlorides.free.sulfur.dioxide.total.sulfur.dioxide.density.pH.sulphates.alcohol.quality: chr "7;0.27;0.36;20.7;0.045;45;170;1.001;3;0.45;8.8;6" "6.3;0.3;0.34;1.6;0.049;14;132;0.994;3.3;0.49;9.5;6" "8.1;0.28;0.4;6.9;0.05;30;97;0.9951;3.26;0.44;10.1;6" "7.2;0.23;0.32;8.5;0.058;47;186;0.9956;3.19;0.4;9.9;6" ...
但我期望输出的格式是这样的:
'data.frame': 4 obs. of 4 variables:
$ id : int 10 11 12 13
$ name : chr "sai" "ram" NA "sahithi"
$ dob : chr "1990-10-02" "1981-03-24" "1987-06-14" "1985-08-16"
$ gender: chr "M" "" "F" "F"
问题出在哪里?如何解决?
数据集上的链接:http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv
read.csv
使用逗号作为分隔符
您的数据集有分号。尝试read.table(<filename>, header = TRUE, sep = ";")
。