CSV in r markdown

我的csv文件的截图我将如何组织数据从https://users.stat.ufl.edu/~winner/data/sexlierel.dat作出准确的分析?我在用给我的方式绘制不同类型的数据时遇到了麻烦。

描述:https://users.stat.ufl.edu/~赢家/数据/sexlierel.txt

```{r}
data_set <- read.csv("project_data.csv", header = TRUE)
names(data_set)
summary(data_set)
summary(data_set$Gender)
data=data.frame("Gender","Count")
```

我试图找到每个类别(count)中人数之间的关系。我觉得用数据给出的方式很难做到这一点。我应该重新排列我的csv文件吗?

```{r}
scatter=ggplot(data=data, aes("Gender", "Count")) + geom_point()
```

我不认为数据是"真实的";CSV文件。没有逗号或其他分隔符。

你可能需要看一下read。TSV是TAB分隔的数据?

正如@CALUM Polwart所说，这不是一个逗号分隔的文件。它是一个固定宽度的文件。还可以将空格视为分隔符。有许多包的功能可以提供帮助。例如，您可以使用

library(data.table)
data_set <- fread("so/sexlierel.txt")

或

library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt")

您可能需要在读取时设置列名。你可以使用

library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt", col_names = c("gender", "scale", "psm", "ptl", "religiosity", "count"))

或

library(tidyverse)
data_set <- readr::read_table("so/sexlierel.txt")
names(data_set) <- c("gender", "scale", "psm", "ptl", "religiosity", "count")

相关内容

最新更新

热门标签：