用ground truth元数据渲染文本



我正在研究光学字符识别。在我们的工作中,我们需要自动生成一些渲染词图像,我们需要渲染词图像中每个字符的位置(边界)。这个关于渲染图像的元数据被称为ground truth。我该怎么做呢?

我发现了一个名为Pango的渲染c api,其中有一个名为pango_layout_Iter_get_char_extent()的函数可以用于此。

https://developer.gnome.org/pango/stable/pango-Layout-Objects.html pango-layout-iter-get-char-extents

最新更新