我有几个问题,除非我缺少某些内容或不了解插图过程/逻辑,否则我真的找不到任何内容。
基本上最重要的是,由于有时"估算"值不同,因此我想以平均值(如果是数字)或模式为分类值。
我看到的所有示例显示了"完整(Miced_model,1)"。如果我使用5或10个不同的迭代运行MICE型号,我看不到仅选择的观点。我想要所有的平均值。
有人可以告诉我如何做吗?
set.seed(2016)
library(mice)
nhanes # this is the dataset
nhanes[5,1]=NA # setting up some categorical examples
nhanes[1,1]=NA
nhanes$age = as.factor(nhanes$age)
imputed_values = mice(nhanes, m = 5, method='rf',maxit = 3)
new_nhanes = complete(imputed_values, 'long') # or repeated? or what?
new_hanes_fixed = # new data frame with averaged values imputed rather than just arbitrary '1st' iteration?
谢谢!
您应该查看Simong的评论
您完全处于错误的轨道上。多个插补的重点是您具有不同的估算数据集。(您将进行分析)
如果您不需要多个插补,则可以直接使用单个插补方法。(例如,来自VIM软件包的KNN或IMRI函数)
听起来您想汇总分析结果,然后在每个估算的数据集上运行分析。在此处阅读更多有关汇总数据的信息:https://www.r-bloggers.com/imputing-missing-data-with-r-mice-package/