像素边框



我目前正在玩张量流和mnist代码。Yann Lecun的mnist数据集包含20x20像素的图像,通过计算像素的质心,这些图像以28x28图像为中心。结果是至少有一个 4 像素的边框,这改善了结果分析。我已经在mnist上搜索并阅读了很多内容,但是我找不到为什么使用4像素。我正在计算 100x100 像素的图像,其中包含 5 像素边框,但我不知道这是否足够。我可以尝试更改边框大小并比较结果,但这需要很长时间。我认为知识和应用良好做法更好。那么如何定义最佳边框大小呢?

根据我的经验,在 MNIST 之外使用边框根本不是常见的做法。如果你试图识别图像(而不是数字)中的对象,你应该只提供整个图像,可能有一些随机裁剪或其他扭曲来帮助学习过程。其他任务的最佳实践因领域而异,但通常来自对模型在生产中可能遇到的输入的相当常识性的直觉。

最新更新