将规范化应用于 RGB 图像并获取 RGB 图像作为输出



我的问题很短,也很幼稚,但我在互联网上找到了非常不同的答案。规范化 RGB 图像的最有效(在计算机视觉社区中实际使用(的方法是什么?
这个问题来自这样一个事实,即像PCA甚至对比度归一化这样的算法经常在其2D版本中被描述。因此,对于白化/全局对比度归一化或任何您喜欢的预处理图像以馈送到您喜欢的统计方法的方法:您是单独考虑每个通道还是将 depth-3 的东西重塑为矩形 2D 数组(深度为 1((以及如何在保留结构的同时做到这一点(做你的事情,然后将其拆分回原来的形状?

我认为每种方法都有其优点,考虑到图像作为一个整体似乎更有意义,但单独应用于每个通道更简单。

你的问题没有简单的答案。

对于大多数任务,在单独的RGB或HSI通道上运行就足够了。无论如何,图像处理中的大多数图像都是灰度的,因此大多数算法都需要灰度输入。在大多数情况下,预处理的唯一目的是将信息减少到必要的最低限度。因此,不存在具有保留结构的"恢复其以前的形状"的 RGB 输出。至少在我的世界里。如果您希望从 RGB 输入输出 RGB,您将实现一个对 RGB 值进行操作的函数。除非您可以将计算简化为灰度并且已经实现了必要的灰度函数。如何将图像重塑为 2D 阵列?通常图像是2D阵列...

我会让我的答案特定于 ZCA 美白,但我想其他人也一样:
由于PCA的输入具有(nsamplesxfeatures(维度的2D矩阵的形状。我想使用 RGB 通道作为 n样本,并将这些通道中的图像扁平化为特征。
答案似乎是使用 nsamples 作为 nsamples(如果您有多个 RGB 图像,则拥有的图像数量(并使用完全扁平化的 RGB 图像作为特征。
这个答案使我相信,如果你想对图像进行归一化,你应该使用图像的一般平均值和一般标准差,而不是单独考虑每个通道。如果有人不同意他可以自由评论,我同意我的问题有点太宽泛了。

最新更新