我想了解用于离线手写识别的X-Y-cut算法。
X-Y-cut是一种基于直方图的方法,用于自动手写识别。
该算法的第一步如下:
- 我们使用包含键入文本的二值化图片。
- 我们计算每行的黑色像素数,并将值投影在 Y 轴上。
- 我们对 X 轴做同样的事情。
在这个阶段,在应用分类技术之前,我想知道我们在获得带有直方图的 X 轴和 Y 轴后所做的更多细节,这些直方图显示了许多黑色像素。
所以,想法如下。
在 Y 轴上投影每行黑色像素后,我们可以根据白色像素的 X 投影识别负责字母切割直方图每行的黑色像素。