我正在尝试在数据集中填充丢失的数据,而导师建议我在Python,特别是MICE算法中使用了Fancy Impute软件包。首先,当我阅读有关小鼠的情况下,很明显,如果我的数据丢失不是随机的,那是一个糟糕的选择(我怀疑这似乎丢失的数据更有可能在特定的国家/年中)。那么有人推荐其他算法吗?(我的项目基于世界银行性别统计数据)。
技术问题:我在我的数据框架上运行了此代码:
filled = MICE().complete(dfvars)
但是我遇到了这个错误,我的导师不知道它是什么,我还没有发现其他任何在Python中讨论小鼠的论坛:
TypeError: ufunc 'isnan' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe''
遇到错误是因为小鼠仅用于算数数字数据,如果数据集包含分类数据,但是您希望算数数字数据,则应仅使用DataFrame的数字列。如果缺少分类数据,则必须使用其他算法。