韦卡分类器准确性



我有来自 17 个类的 73,841 个数据实例,我正在使用这些数据来训练 WEKA 的分类器。 数据已使用 FFT 进行过滤,每个实例有三个点。

I.e. 85724.5409, 40953.2485, 3204935, 4539024.002345, ?/class

我尝试了三个分类器:SMO/J48/Naive Bayes。

SMO/朴素贝叶斯的准确率达到16%

但 J48 分类器的准确率为 98/99%。

问题:

  1. 我可以安全地假设 J48 分类器犯了某种错误吗?两个结果怎么会如此相似,而另一个结果却完全不同?

  2. 我该怎么做才能提高准确性?是不是类太多了,类根本就分不开吗?

谢谢

我强烈认为决策树的输出是不准确的。

您能否提供生成的树或前 10 个节点以查看确切的问题是什么。

以下是我建议的一些提高准确性的措施。

    班级
  • 规模:17个班级确实很大。尝试通过合并类似的类来减少。(仅在不影响项目范围的情况下才这样做。
  • 非衬板分类器:由于您有 17 个类,像朴素贝叶斯/决策树这样的线性分类器是不够的。您是否尝试过任何非线性 SVM 或集成学习,例如随机森林。如果 17 个类中的每一个都存在足够的数据集,那么 HMM 将是更好地分类的不错选择。

谢谢阿拉维

最新更新