我正在做文本检测和识别。我使用过Craft(字符区域感知进行文本检测(https://github.com/clovaai/CRAFT-pytorch。它给了我一个带有边界框的图像输出和一个带有数字的文本文件。我想将输出馈送到 CRNN https://github.com/bgshih/crnn .但我需要文本图像的投资回报率才能使 CRNN 工作。如何连接工艺和 CRNN
我认为您需要向CRNN网络提供裁剪的图像以识别字符。
简单方法如下:
- 为
CRAFT_pytorch
提供图像 - 裁剪并保存图像,通过边界框结果输出
CRAFT_pytorch
- 将裁剪的图像作为输入提供给
CRNN
如果调用两个函数CRAFT_pytorch
并一次CRNN
,则可以跳过在第 2 阶段保存裁剪的图像。