我是WEKA
的新手,我有一个带有109 attributes
的111 cases
数据集。我正在使用CfsSubsetEval
中的WEKA中的功能选择选项卡,而BestFirst search method
用于feature selection
。我正在使用leave-one-out cross-validation
。
因此,WEKA选择有多少个功能,或者在跨验证的每个步骤中选择该方法的停止标准是什么
谢谢,
gopi
CfsSubsetEval
算法正在搜索一个可以很好地工作的特征(在功能之间具有较低相关性,并且与目标标签的高相关性之间的相关性很低)。子集的分数称为功绩(您可以在输出中看到它)。
BestFirst
搜索不允许您确定要选择的功能数量。但是,您可以使用其他方法,例如GreedyStepWise
或使用Ranker
的InformationGain
/GainRatio
算法并定义了功能集的大小。
您可以用来影响集合大小的另一个选项是搜索的方向(向前,向后...)。
祝你好运