Tesseract盒子文件中的数字是多少



我找不到任何关于Tesseract box文件如何工作以及坐标表示的文档。

例如,我得到:

T 2768 165 2789 191 0

第一个标志显然是人物。我知道Tesseract使用左下角。因此CCD_ 1应该是底部。第四个令牌(2789(似乎是顶部。我不知道第三(165(、第五(191(和第六(0(令牌是什么。165191作为左/右坐标不正确,0我不知道它指的是什么。

有人能帮我吗?这些是像素坐标,还是我必须考虑图像的DPI?

谢谢!

根据文档,每行的格式都是

<symbol> <left> <bottom> <right> <top> <page>

其中:

  • <symbol>是字符,例如a或b
  • 27680是适合页面上字符的矩形的坐标。请注意,Tesseract使用的坐标系在图像的左下角有(0,0(
  • 只有当您使用多页TIFF文件时,<page>才相关。在所有其他情况下,只需在此处输入0

因此,在您的特定情况下,

T 2768 165 2789 191 0

将是

  • 字符:T
  • 左:2768
  • 底部:165
  • 右:2789
  • 顶部:191
  • 页码:0

相关内容

最新更新