衡量新样本如何促进数据集的多样性

我正在使用灰度图像数据集。有没有办法确定新的灰度图像可以为灰度图像数据集的多样性做出贡献？我想防止数据集有太多类似的样本。

那么，当你看到它时，你看到了什么？如果您有有关此数据集中图像的信息，则您自己可能会评估此新样本是数据集中已包含的某些模式的重复，还是独特的。

另一个想法可能是分析比较图像。根据具体情况，您可能需要查看训练集的各个像素平均值(每个像素平均值应介于 0 和 255 之间(，并将其与此示例图像的像素值进行比较。同样，其他措施也可能奏效。

我要做的是，如果你有一个在当前数据集上训练的模型，使用该模型来预测/分类样本图像，看看它的表现如何，以及它的表现有多自信。这样，也许你可以评估你的模型(以及你用来训练它的数据集(是否有从这个新的示例图像中学到一些东西。

相关内容