Weka - 如何查找分类器的输入格式 - Weka - How to find input format for classifiers 小贝子编程网

我在Java程序中使用Weka对一些文本文档进行分类，并使其与NaiveBayesMultinomial分类器配合良好。

但是，我似乎找不到有关如何过滤我的实例（或 ARFF 文件）以便其他分类器可以接受它们作为输入的任何文档。如果我将 ARFF 加载到 Weka 资源管理器 GUI 中，那么大多数分类器都会灰显。使用StringToWordVector过滤器不会影响这一点，我也尝试了其他一些。

谁能告诉我如何准备我的数据，以便它被其他分类器接受，例如NaiveBayes，JRip或BayesNet？

在WEKA Explorer GUI中，当您应用StringToWordVector时，以前的类属性通常被移动到第一个属性，因此默认情况下不会将其检测为类。当您在分类选项卡中时，请确保选择正确的属性作为实验的类。

问题的另一个潜在来源是该类是数字的，因此阻止了某些算法（期望一个名义类）的应用。

如果这不能解决您的问题，请发布您的 ARFF 文件的摘录（标题摘录加一个实例），以便我们提供更准确的建议。

Weka - 如何查找分类器的输入格式