我正在尝试使用R
中的UBL
包中的SMOGNRegress
对具有连续目标变量的不平衡数据集进行抽样。
当我运行代码时:
SMOGNRegress(Deceased~., normalized_data, rel = "auto", thr.rel = 0.9999, C.perc = "balance", k = 2, repl = F, dist = "Euclidean", pert = 0.01)
我得到以下错误:
'names'属性[35563]必须与向量[1]长度相同
从关于此错误的类似问题中,我看到这是一个长度不匹配的问题,但我无法围绕如何修复这个问题来生成新的过采样数据集。
确保这个函数知道"normalized_data"是一个数据框架为我工作。
SMOGNRegress(Deceased~., as.data.frame(normalized_data), rel = "auto", thr.rel = 0.9999, C.perc = "balance", k = 2, repl = F, dist = "Euclidean", pert = 0.01)