我有一个数据集,我从一个公共网站使用他们的R包,我有完整的列表。我对英格兰的一个特定地区感兴趣,该地区包含在ParentName字段中。所以,下面的代码可以工作:
mydata <- df[df$ParentName %in% c("South East region"),]
但是,如果我想将其与英格兰整体进行比较,它在ParentName中没有值,因此我希望基本上过滤ParentName为NULL/空白或字符串值"东南地区">
我该怎么做呢?我对R非常陌生,没有受过任何培训,所以它可能是非常简单的东西,但我似乎只能找到如何摆脱空白的指南!谢谢所有。
我试过使用||,但我不认为这是工作,或者我做错了。
如果我理解正确,这将工作:
mydata <-
df[(df$ParentName == "South East region")|(df$ParentName == "")|(is.na(df$ParentName)),]
我建议您稍后再看dplyr
包,它将使数据操作更容易。