我的csv文件的截图我将如何组织数据从https://users.stat.ufl.edu/~winner/data/sexlierel.dat作出准确的分析?我在用给我的方式绘制不同类型的数据时遇到了麻烦。
描述:https://users.stat.ufl.edu/~赢家/数据/sexlierel.txt
```{r}
data_set <- read.csv("project_data.csv", header = TRUE)
names(data_set)
summary(data_set)
summary(data_set$Gender)
data=data.frame("Gender","Count")
```
我试图找到每个类别(count)中人数之间的关系。我觉得用数据给出的方式很难做到这一点。我应该重新排列我的csv文件吗?
```{r}
scatter=ggplot(data=data, aes("Gender", "Count")) + geom_point()
```
我不认为数据是"真实的";CSV文件。没有逗号或其他分隔符。
你可能需要看一下read。TSV是TAB分隔的数据?
正如@CALUM Polwart所说,这不是一个逗号分隔的文件。它是一个固定宽度的文件。还可以将空格视为分隔符。有许多包的功能可以提供帮助。例如,您可以使用
library(data.table)
data_set <- fread("so/sexlierel.txt")
或
library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt")
您可能需要在读取时设置列名。你可以使用
library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt", col_names = c("gender", "scale", "psm", "ptl", "religiosity", "count"))
或
library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt")
names(data_set) <- c("gender", "scale", "psm", "ptl", "religiosity", "count")