我的数据帧有58000多行和26列。我将删除58000多行的行。如果超过5%的变量为NA,则删除行。
我们可以在使用is.na
创建的逻辑矩阵上使用rowMeans
df1[rowMeans(is.na(df1)) <= 0.5, , drop = FALSE]
在上面的代码中,is.na(df1)
返回TRUE(对于NA(和FALSE(对于非NA(的逻辑矩阵,使用rowMeans
,我们计算行中TRUE值的百分比,检查它是否小于或等于0.5以创建逻辑向量,并将其用作行索引来对行进行子集