组合R中的两个子集



我在大学的数据驱动商业课程中学习R,所以这对我来说是全新的。我正在做一个数据项目,分析.csv文件中的数据。

我试过了,但没有给我提供正确的结果。

我的问题是从列"中删除基于值的行;Year_Birth">
我尝试过:

# Read a csv file using read.csv()
csv_file = read.csv(file = "filtered_data.csv", 
stringsAsFactors = FALSE, header = TRUE)
BabyBoomer = csv_file$Year_Birth[ csv_file$Year_Birth >= 1946 & csv_file$Year_Birth <= 1964]
head(BabyBoomer)
print::
[1] 1957 1954 1959 1952 1946 1946
y = csv_file$Year_Birth[csv_file$Year_Birth <= 1964]
BabyBoomer <- csv_file[-c(y), ]
head(BabyBoomer)
print:: df but without something changed

我希望能够创建一个子集,删除那些<=1964年

y = csv_file$Year_Birth[csv_file$Year_Birth <= 1964]

在执行上面的片段之后,y将包含向量Year_Birth<=1964,但是你需要提取你想要的子集是一个包含数据帧索引的向量,其中Year_Birth<=1964.这个代码可以做到这一点:

y <- which(csv_file$Year_Birth <= 1964)
BabyBoomer <- csv_file[ y, ]
head(BabyBoomer)

尝试使用y <- subset()函数。这样你就可以说subset(dataset, dataset$year <= 1946)

编辑:然后你也可以说,如果你只想要一个包含年份的矢量,你可以说subset(dataset$year, dataset$year <= 1946)

查看这些文档,对我入门有很大帮助:https://homerhanumat.github.io/elemStats/

希望这能有所帮助!

相关内容

  • 没有找到相关文章

最新更新