我正在使用weka 3.6.13
并尝试使用模型对数据进行分类:
java -cp weka-stable-3.6.13.jar weka.classifiers.Evaluation weka.classifiers.trees.RandomForest -l Parking.model -t Data_features_class_ques-2.arff
java.lang.Exception: training and test set are not compatible
尽管该模型在使用 GUI 时有效,但通过资源管理器>Claasify ->提供的测试集并加载 arff 文件>右键单击结果列表并再次加载模型>右键单击 -> 在当前数据集上重新评估模型......
任何指示请帮助。
如果您的数据包含"字符串"特征,则首先在批处理模式下使用 StringToWordVector,即在单个命令(命令 1)中对两个数据集使用,然后使用命令 2 和命令 3。
命令 1.
java weka.filters.unsupervised.attribute.StringToWordVector -b -R first-last -i training.arff -o training_s2w.arff -r test.arff -s test_s2w.arff
命令 2.
Java weka.classifiers.trees.RandomForest -t training_s2w.arff -d model.model
命令 3.
java weka.classifiers.trees.RandomForest -T test_s2w.arff -l model.model -p 0> result.txt
PS:相应地为weka添加路径.jar。