视频图像到文本提取的最佳自适应阈值方法



我正在寻找用于图像二值化的最佳自适应阈值方法。我找到了Derek Bradley和Gerhard Roth的"使用积分图像的自适应阈值"。你能帮我找出哪种自适应阈值方法最适合对同时包含文本和其他对象的文档进行二进制化吗?提前谢谢。

常用的方法是Sauvola二值化(如上文所述)。然而,已经提出了许多旨在改进它的系统,其中许多专门研究特定领域,比如你上面提到的论文,它似乎专门研究梯度照明。这是我不久前偶然发现的一篇论文,可能正是你想要的。讨论了视频中文本的二值化问题。作者还为他的方法以及更标准的Sauvola和Niblack方法提供了代码。这可以让你比较一些结果,看看什么最适合你。

最新更新