我有两个问题。
- 我想获得性格自信值。目前,我对每个单词都很有信心。让我们说"你好"-mean置信度:90。我想要这样:
- ";H〃-置信度:90
- "e"-置信度:94
- 目前我正在将ocrText和分段矩形分开。我需要这些信息。让我们说:
- 100 100 100 100";H〃
- 110 100 110 100";e">
...
private TesseractEngine tesseract = new TesseractEngine(path, "eng", EngineMode.LstmOnly);
....
using (var page = tesseract.Process(image, rec, PageSegMode.Auto))
{
text= page.GetText(); // returns the ocr text of the whole rectangle
confidence = page.GetMeanConfidence(); // returns the confidence for the whole word.
List<System.Drawing.Rectangle> rectangles = page.GetSegmentedRegions(PageIteratorLevel.Symbol); //returns each character reactangle of the word.
}
谢谢你的帮助!:(
您需要获得ResultIterator
对象(通过page.GetIterator()
方法(,然后在PageIteratorLevel.Symbol
级别对其进行操作。例如,请检查PageSerializer类。