我找不到任何关于Tesseract box文件如何工作以及坐标表示的文档。
例如,我得到:
T 2768 165 2789 191 0
第一个标志显然是人物。我知道Tesseract使用左下角。因此CCD_ 1应该是底部。第四个令牌(2789
(似乎是顶部。我不知道第三(165
(、第五(191
(和第六(0
(令牌是什么。165
和191
作为左/右坐标不正确,0
我不知道它指的是什么。
有人能帮我吗?这些是像素坐标,还是我必须考虑图像的DPI?
谢谢!
根据文档,每行的格式都是
<symbol> <left> <bottom> <right> <top> <page>
其中:
<symbol>
是字符,例如a或b2768
0是适合页面上字符的矩形的坐标。请注意,Tesseract使用的坐标系在图像的左下角有(0,0(- 只有当您使用多页TIFF文件时,
<page>
才相关。在所有其他情况下,只需在此处输入0
因此,在您的特定情况下,
T 2768 165 2789 191 0
将是
- 字符:
T
- 左:
2768
- 底部:
165
- 右:
2789
- 顶部:
191
- 页码:
0