我有一个关于使用自动编码器进行异常检测/新颖性检测的特征归一化/标准化(缩放(的问题。通常在ML问题中,我们会对训练集/测试集进行拆分。在列车上拟合正常/标准缩放器,并使用它来转换(Not Fit_transform(测试数据。但是,在异常检测/新颖性检测中,我们如何只使用"正常"数据(而不是任何"异常"(来训练异常检测器?在这里,训练数据不会代表测试数据,因为它只在"正常"数据上学习,因此在给定"异常"数据时会产生重建错误。在这里,我们应该对列车数据进行归一化,并使用它来转换异常吗?我认为这是不恰当的。如果能产生解释性结果,那么可以单独缩放列车和测试数据吗?
您的测试集应该包含正常和异常数据点,并且;正常的";积分必须与您的训练数据相似。因此,您可以像往常一样对训练数据进行缩放/规范化。