我正在尝试使用 Knn 估算数据集中的缺失值。谁能向我建议这种方法的概念以及如何通过在scikit-learn中使用Knn来做到这一点。
提前谢谢你。
你可以使用来自Sklearn的KNN imputer,注意:仅适用于数值数据而不是分类数据,我知道,因为我尝试过分类
将 numpy 导入为 NP
从sklearn.impute import KNNImputer
X = [[1, 2, np.nan], [3, 4, 3], [np.nan, 6, 5], [8, 8, 7]]
imputer = KNNImputer(n_neighbors=2)
imputer.fit_transform(X)
请转到此链接以获取更多信息