我正在使用张量流对象检测API来检测图像上的文本。它给了我一个很好的结果,非常准确。如何从左到右对边界框进行排序,以使文本具有可读的形式。
一个简单的技巧是根据输出边界框的 xmin 坐标对输出边界框进行排序。对于 y 坐标,只需取 ymin 和 ymax 的平均值,并将所有具有相同平均值加上 samll tolerace 放在一个列表中。这样,您将获得有序的列和行
我正在使用张量流对象检测API来检测图像上的文本。它给了我一个很好的结果,非常准确。如何从左到右对边界框进行排序,以使文本具有可读的形式。
一个简单的技巧是根据输出边界框的 xmin 坐标对输出边界框进行排序。对于 y 坐标,只需取 ymin 和 ymax 的平均值,并将所有具有相同平均值加上 samll tolerace 放在一个列表中。这样,您将获得有序的列和行
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium