Weka GUI - TF-IDF不计算-请帮助我的学术工作



我想在WEKA GUI中使用KNN算法和TF-IDF。首先,我在默认条件下运行算法。其次,我选择"IDFTransform"one_answers"TFTransform"为"true"在StringToWordVector过滤器和运行。
结果无差异。

Result1:编写此表达式

Correctly Classified Instances        1346               91.3781 %

Result2:

Correctly Classified Instances        1346               91.3781 %

我的"。Arff "文件如下:

@relation et9
@attribute 'alis' real
@attribute 'banka' real
...
@attribute 'urun' real
@attribute 'class' {yes, no}
@data
70,0,0,0,3,0,40,0,3,1,0,0,20,0,717,2,4,0,0,0,2,5,0,0,0,717,0,1,0,30,yes
22,0,0,63,158,0,1,0,7,0,10,0,4,0,57,0,0,0,0,204,0,0,2,2,0,530,0,0,6,0,yes
0,0,1,0,0,0,0,0,2,1,3,0,0,0,0,0,5,0,0,0,0,0,2,1,0,0,0,0,0,0,no
...


我知道stringtoworvector是用于字符串的。但我想计算TF-IDF。飞机救援消防"文件。我如何使用我当前的"。arff"文件,并有KNN算法结果与TF-IDF?

这是我的学术工作。请帮助…)

根据Weka的文档,StringToWordVector过滤器"将字符串属性转换为一组表示单词出现的属性[…]"。因此,将此筛选器应用于不包含任何String属性的arff文件将不会对数据集产生影响。

为了使用这个过滤器,您需要准备一个包含String属性的arff文件,其中这个属性的值是给定实例的文本。例如,如果每个实例代表一条tweet,那么tweet中的文本将是这个String属性的值。关于在weka中使用文本的更多信息,请参考此处。

最新更新