为了对调查数据应用权重等,我正在使用survey
软件包。其中包括一个奇妙的函数svymean()
,它给了我一对整齐的平均误差和标准误差。我现在有几个这样的对,希望它们与rbind()
组合成一个data.frame。
library(survey)
data(fpc)
fpc.w1 <- with(fpc, svydesign(ids = ~0, weights = weight, data = fpc))
fpc.w2 <- with(fpc, svydesign(ids = stratid, weights = weight, data = fpc))
(msd.1 <- svymean(fpc$x, fpc.w1))
# mean SE
# [1,] 5.4481 0.7237
(msd.2 <- svymean(fpc$x, fpc.w2))
# mean SE
# [1,] 5.4481 0.5465
rbind(msd.1, msd.2)
# [,1]
# msd.1 5.448148
# msd.2 5.448148
可以看出,SE不见了。检查对象会产生以下结果:
class(msd.1)
# [1] "svystat"
str(msd.1)
# Class 'svystat' atomic [1:1] 5.45
# ..- attr(*, "var")= num [1, 1] 0.524
# .. ..- attr(*, "dimnames")=List of 2
# .. .. ..$ : NULL
# .. .. ..$ : NULL
# ..- attr(*, "statistic")= chr "mean"
所以我做了一些猜测。
msd.1$mean
# Error in msd.1$mean : $ operator is invalid for atomic vectors
msd.1$SE
# Error in msd.1$SE : $ operator is invalid for atomic vectors
msd.1[2]
# [1] NA
msd.1[1, 2]
# Error in msd.1[1, 2] : incorrect number of dimensions
包中包含一个名为SE()
的函数,该函数产生:
SE(msd.1)
# [,1]
# [1,] 0.723725
好的。通过这个,我终于可以完成绑定这些行的解决方案:
t(data.frame(msd.1=c(msd.1, SE(msd.1)),
msd.2=c(msd.2, SE(msd.2)),
row.names = c("mean", "SD")))
# mean SD
# msd.1 5.448148 0.7237250
# msd.2 5.448148 0.5465021
我真的必须忍受捆绑行的包裹带来的痛苦吗?还是我错过了什么?
您只需将svymean
输出强制为一个数据帧,然后将rbind
输出一起。
do.call(rbind, lapply(list(msd.1, msd.2), as.data.frame))
mean SE
1 5.448148 0.7237250
2 5.448148 0.5465021
如果要添加名称,则必须命名列表中的项目,然后在lapply
中设置USE.NAMES = TRUE
do.call(rbind, lapply(list("msd.1"= msd.1, "msd.2" = msd.2), as.data.frame, USE.NAMES = TRUE))
mean SE
msd.1 5.448148 0.7237250
msd.2 5.448148 0.5465021
或者tidyverse
选项将是
library(tidyverse)
list(msd.1, msd.2) %>%
map_df(as.tibble)
# A tibble: 2 x 2
# mean SE
# <dbl> <dbl>
#1 5.448148 0.7237250
#2 5.448148 0.5465021