用于离线手写识别的 X-Y-cut 方法如何工作?



我想了解用于离线手写识别的X-Y-cut算法。

X-Y-cut是一种基于直方图的方法,用于自动手写识别。

该算法的第一步如下:

  1. 我们使用包含键入文本的二值化图片。
  2. 我们计算每行的黑色像素数,并将值投影在 Y 轴上。
  3. 我们对 X 轴做同样的事情。

在这个阶段,在应用分类技术之前,我想知道我们在获得带有直方图的 X 轴和 Y 轴后所做的更多细节,这些直方图显示了许多黑色像素。

所以,想法如下。

在 Y 轴上投影每行黑色像素后,我们可以根据白色像素的 X 投影识别负责字母切割直方图每行的黑色像素。

最新更新