Weka:如果测试运行之后是训练运行，训练会有帮助吗?

我有一个疑问。我理解了交叉验证和拆分的概念，其中分类器将从训练数据中学习并测试测试数据拆分。

如果我首先使用"使用训练数据"运行分类，然后跟进分类选项卡中的"SUpplied 测试集"选项并再次运行，是否会发生同样的事情。

为了在分类选项卡中更清楚地说明这一点，我正在运行两次......首先在预处理选项卡下上传训练数据集，然后使用在分类选项卡"提供的测试集"optoin中上传的测试集运行。那么，在执行测试数据时，模型是否使用之前完成的训练？

我使用了朴素贝叶斯分类器。我也怀疑是所有分类器都从训练数据中学习，还是只是像神经网络这样的分类器，决策树？

您在"分类选项卡"中提到的选项允许您选择如何评估已构建的模型。每次在分类选项卡中按"开始"时，都会构造一个新的分类器。对于列出的选项，此分类器将使用"预处理"选项卡中的整个当前数据集。 无论是提供测试数据集还是使用训练数据，都将构建相同的分类器。 Weka 在构造新分类器时不会使用以前构建的分类器中的任何信息，至少以您描述的方式。

两个测试选项之间的区别如下：

"使用训练数据"将使用构造的分类器来预测训练实例。此选项通常会对分类器的未来性能给出过于乐观的估计。
"提供的测试集"将使用独立的测试集。鉴于此测试集是以公平的方式构建的，您应该对分类器的未来性能进行公正的估计。

为了解决您的最后一个问题，大多数分类器都尝试从训练数据中诱导模型。这通常被认为是学习。但是，某些分类器(例如 IBk(不会诱导模型，而是使用训练数据本身进行未来预测。这些都是相当精细的观点，最好只是说所有 Weka 分类器都根据训练数据做出预测。

相关内容

最新更新

热门标签：