在执行功能选择时,在每个跨验证步骤中选择特征时,CFSSUBSETEVALUATOR使用了多少和/或哪些标准



我是WEKA的新手,我有一个带有109 attributes111 cases数据集。我正在使用CfsSubsetEval中的WEKA中的功能选择选项卡,而BestFirst search method用于feature selection。我正在使用leave-one-out cross-validation

因此,WEKA选择有多少个功能,或者在跨验证的每个步骤中选择该方法的停止标准是什么

谢谢,

gopi

CfsSubsetEval算法正在搜索一个可以很好地工作的特征(在功能之间具有较低相关性,并且与目标标签的高相关性之间的相关性很低)。子集的分数称为功绩(您可以在输出中看到它)。

BestFirst搜索不允许您确定要选择的功能数量。但是,您可以使用其他方法,例如GreedyStepWise或使用RankerInformationGain/GainRatio算法并定义了功能集的大小。

您可以用来影响集合大小的另一个选项是搜索的方向(向前,向后...)。

祝你好运

最新更新