我想做一个回归任务(在一些大小约为150x70像素的图像中找到对象的x,y位置(。因此,我有大约2000张带注释的图像(我可以注释更多,可能多达20000张(。我的第一个想法是使用CNN,但我输入数据的大小不一致,我不想因为调整图像大小或裁剪图像而丢失功能。你觉得怎么样有比使用CNN更好的方法吗?如何处理图像大小的变化
好吧,如果你不想重新缩放或裁剪,这就是问题所在。那么您将无法进行批量处理。
您可以将输入图像缩放为一个大小。只需确保所有训练图像的大小相同,并且需要对基本事实(绑定框(进行类似的转换。
大问题:我不想将变换应用于边界框,而且这很复杂
这里有一个简单的图书馆相册,可以为你做所有这些。你不必担心数学-图书馆-https://github.com/albumentations-team/albumentations