如何识别和处理有噪声的数据观测?



例如,有些人在调查中给出了不诚实的答案,有些变量已知有测量误差,或者有些图像有噪声。这些观察结果是有噪声的,可以掩盖"真实"。信号,当我们训练数据时。我们如何识别这些观察值并删除它们以使训练集"更干净"?

你不能。例如,下面是一个数字序列,我在其中插入了一个假的:

11, 8, 14, 19, 21, 15.

是哪个?

接受你得到的数据代表了你的受众,包括诚实和不诚实的行为。

最新更新