Bradley自适应阈值——困惑(问题)

关于Bradley实现自适应阈值，我有一些问题，可能很愚蠢。我读过关于它的论文http://people.scs.carleton.ca:8008/~roth/iit出版物iti/docs/gerh-50002.pdf，我有点困惑。主要关于这个声明：

if ((in[i,j]*count) ≤ (sum*(100−t)/100)) then

让我们假设我们有这样的输入：

width, i
[0] [1] [2]
+---+---+---+
height [0] | 1 | 2 | 2 |
j          +---+---+---+
[1] | 3 | 4 | 3 |
+---+---+---+
[2] | 5 | 3 | 2 |
+---+---+---+

我们可以这样说：

s = 2
s/2 = 1
t = 15
i = 1
j = 1 (we are at the center pixel)

这意味着我们有一个3x3的窗口，对吧？然后：

x1 = 0, x2 = 2, y1 = 0, y2 = 2

什么是计数？如果它是窗口中的像素数，为什么根据算法它是2*2=4，而不是3*3=9？此外，为什么像素的原始值乘以计数？

论文称，该值与周围像素的平均值进行了比较，为什么它不是

in[i,j] <= (sum/count) * ((100 - t) / 100)

那么呢？

有人能给我解释一下吗？这个问题可能很愚蠢，但我想不通。

在开始之前，让我们展示他们论文中写的算法的伪代码：

procedure AdaptiveThreshold(in,out,w,h)
1: for i = 0 to w do
2:     sum ← 0
3:     for j = 0 to h do
4:         sum ← sum+in[i, j]
5:         if i = 0 then
6:             intImg[i, j] ← sum
7:         else
8:             intImg[i, j] ← intImg[i−1, j] +sum
9:         end if
10:     end for
11: end for
12: for i = 0 to w do
13:     for j = 0 to h do
14:         x1 ← i−s/2 {border checking is not shown}
15:         x2 ← i+s/2
16:         y1 ← j −s/2
17:         y2 ← j +s/2
18:         count ← (x2−x1)×(y2−y1)
19:         sum ← intImg[x2,y2]−intImg[x2,y1−1]−intImg[x1−1,y2] +intImg[x1−1,y1−1]
20:          if (in[i, j]×count) ≤ (sum×(100−t)/100) then
21:              out[i, j] ← 0
22:          else
23:              out[i, j] ← 255
24:          end if
25:     end for
26: end for

intImg是输入图像到阈值的积分图像，假定灰度。

我已经成功地实现了这个算法，所以让我们谈谈你的疑虑。

什么是count？如果它是窗口中的像素数，为什么根据算法它是2*2=4，而不是3*3=9？

论文中有一个他们没有谈论的基本假设。s的值需要为奇数，窗口应为：

x1 = i - floor(s/2)
x2 = i + floor(s/2)
y1 = j - floor(s/2)
y2 = j + floor(s/2)

count当然是窗口中的像素总数，但您也需要确保不会越界。你所拥有的应该是一个3 x 3的窗口，所以s = 3，而不是2。现在，如果是s = 3，但如果选择i = 0, j = 0，则x和y的值为负。我们不能这样，所以在这个以i = 0, j = 0为中心的3 x 3窗口中，有效像素的总数是4，所以count = 4。对于在图像边界内的窗口，则count将为9。

此外，为什么像素的原始值乘以计数？论文称，该值与周围像素的平均值进行了比较，为什么不是：
in[i,j] <= (sum/count) * ((100 - t) / 100)
那么呢？

您正在查看的条件位于算法的第20行：

20: (in[i, j]×count) ≤ (sum×(100−t)/100)

我们之所以关注in[i,j]*count，是因为我们假设in[i,j]是s x s窗口内的平均强度。因此，如果我们检查一个s x s窗口并将所有强度相加，这等于in[i,j] x count。这个算法非常巧妙。基本上，我们比较s x s窗口内的假设平均强度(in[i,j] x count)，如果这小于该s x s窗口(sum x ((100-t)/100))内实际平均值的t%，则输出设置为黑色。如果大于，则输出设置为白色。然而，你已经雄辩地指出，应该是这样的：

in[i,j] <= (sum/count) * ((100 - t) / 100)

这基本上与第20行相同，但等式的两边除以count，所以它仍然是相同的表达式。我想说的是，这明确地说明了我上面所说的内容。count的乘法肯定令人困惑，所以你所写的更有意义。

因此，你只是以不同的方式看待它，这完全没关系！因此，为了回答你的问题，你所说的肯定是正确的，相当于实际算法中的表达式。

希望这能有所帮助！

相关内容

最新更新

热门标签：