我的使用ocr函数提取文本的Matlab程序给出了许多置信度较低的误报。有没有办法将ocrtxt.WordConfidence
设置为最小值并忽略所有较低的值?我希望ocrtxt.Words
或ocrtxt.Text
仅高于置信度0.8,以便进一步处理。
ocrtxt = ocr(regionFilteredTextMask);
ocrtxt.Text;
最简单的方法是根据阈值创建一个逻辑索引:
bestWordsIdx = ocrtxt.WordConfidence > 0.8;
bestWords = ocrtxt.Words(bestWordsIdx)
同样适用于文本:
bestTextIdx = ocrtxt.CharacterConfidence > 0.8
bestText = ocrtxt.Text(bestTextIdx)