r语言 - 如何删除包含 75% 缺失值的行以及使用什么插补技术?



我有一个 17631x15 的数据帧,想找到一种简单的方法来删除包含 75% 缺失值的行。我不确定如何在函数中填写阈值:

out<- rowSums(is.na(df))

我的数据显示强烈的昼夜和季节变化,我想知道是否可以用几何平均值替换缺失值?

至于删除行,您可以执行以下操作:

set.seed(2)
df <- data.frame(matrix(sample(c(NA, 1), 1500, replace = T), ncol = 15))
df_sub <- df[rowSums(is.na(df))/ncol(df) <0.75, ]

就插补缺失值而言,主包是mice.在此软件包中,根据您的数据类型,基于各种技术进行了多种插补。此外,您还可以将missForest包用于混合数据。首先检查这些。

相关内容

最新更新