我正在进行预处理,并在我的训练集上使用食谱中的step_downsample来减少名义变量之间的不平衡。我使用的是Fair’s Affairs数据集的一个版本。我采取的第一步是对数据进行初始分割、训练和测试。第二步,我试图降低样本,step_dummy和规范化预测器。我从r收到一个错误,说找不到函数step_downsample,但看起来我是按照我能找到的所有例子来编码的。我也试过加载主题和食谱来使用这个函数。
我正在尝试创建一个配方,基于训练数据,这将:对数据进行采样,将所有分类预测器转换为虚拟变量,并规范化预测变量。
已经写好的代码在
下面affairs_train <- training( affairs_split )
affairs_test <- testing( affairs_split )
head(affairs_train, n=6)
affiars_recipe <- recipe( affair ~ ., data = affairs_train) %>%
step_downsample(affair) %>%
step_dummy(all_nominal_predictors () ) %>%
step_normalize( all_predictors() ) %>%
prep()
从我的阅读在线我已经尝试安装多个软件包。我也试过复制其他人的代码,不幸的是,错误消息是收到的是
step_downsample(。,外遇):找不到函数"step_downsample">
您可能忘记在{recipes}包中加载{themis},因为它包含step_downsample()
。应该是
library(recipes)
library(themis)
affairs_split <- NULL # Code to generate affairs_split
affairs_train <- training( affairs_split )
affairs_test <- testing( affairs_split )
affiars_recipe <- recipe( affair ~ ., data = affairs_train) %>%
step_downsample(affair) %>%
step_dummy(all_nominal_predictors () ) %>%
step_normalize( all_predictors() ) %>%
prep()