我根据给我的数据集创建了一个新的预测模型。它基于许多数字属性预测名义(二进制(类属性(正/负(。
现在我被要求使用这个预测模型来预测新数据集的类。该数据集具有所有相同的属性,除了尚未存在的类列。如何将我的模型应用于此新数据?我尝试在我的新数据集中添加一个空的类列,然后执行以下操作:
- 只需在WEKA的资源管理器中加载新数据集并加载模型。它告诉我没有训练数据
- 在WEKA的资源管理器中打开我的训练集,然后打开我的培训模型,然后选择我的新数据作为"提供的测试集"。它运行,但不输出任何预测
我应该注意,在对交叉验证的训练数据进行测试时,模型运行良好。它还可以很好地处理我多年前为测试/评估使用而分离的训练数据的子集。我想这可能是我如何添加一个新的类列的问题,也许吧?
为了进行预测,Weka需要两个数据集,即训练数据集和用于进行预测的数据集,具有完全相同的结构,直到标签的顺序。这也意味着,您需要有一个具有正确标签的类属性。就类属性的值而言,只需使用缺失的值(用问号表示(。
请参阅常见问题解答如何使用经过训练的模型进行预测?有关如何进行预测的更多信息,请访问Weka wiki。