Weka:如果测试运行之后是训练运行,训练会有帮助吗?



我有一个疑问。我理解了交叉验证和拆分的概念,其中分类器将从训练数据中学习并测试测试数据拆分。

如果我首先使用"使用训练数据"运行分类,然后跟进分类选项卡中的"SUpplied 测试集"选项并再次运行,是否会发生同样的事情。

为了在分类选项卡中更清楚地说明这一点,我正在运行两次......首先在预处理选项卡下上传训练数据集,然后使用在分类选项卡"提供的测试集"optoin中上传的测试集运行。那么,在执行测试数据时,模型是否使用之前完成的训练?

我使用了朴素贝叶斯分类器。我也怀疑是所有分类器都从训练数据中学习,还是只是像神经网络这样的分类器,决策树?

您在"分类选项卡"中提到的选项允许您选择如何评估已构建的模型。 每次在分类选项卡中按"开始"时,都会构造一个新的分类器。 对于列出的选项,此分类器将使用"预处理"选项卡中的整个当前数据集。 无论是提供测试数据集还是使用训练数据,都将构建相同的分类器。 Weka 在构造新分类器时不会使用以前构建的分类器中的任何信息,至少以您描述的方式。

两个测试选项之间的区别如下:

  1. "使用训练数据"将使用构造的分类器来预测训练实例。 此选项通常会对分类器的未来性能给出过于乐观的估计。

  2. "提供的测试集"将使用独立的测试集。 鉴于此测试集是以公平的方式构建的,您应该对分类器的未来性能进行公正的估计。

为了解决您的最后一个问题,大多数分类器都尝试从训练数据中诱导模型。 这通常被认为是学习。 但是,某些分类器(例如 IBk(不会诱导模型,而是使用训练数据本身进行未来预测。 这些都是相当精细的观点,最好只是说所有 Weka 分类器都根据训练数据做出预测。

相关内容

最新更新