首页Tesseract for C# 的文字坐标

Tesseract for C# 的文字坐标

时间: 2024-01-25 09:46:54 浏览: 213

Tesseract for C# 是一个基于 Tesseract OCR 引擎的 C# 封装库，用于识别图像中的文字信息。它可以返回识别结果的文本字符串，但是默认情况下不会返回文字的坐标信息。如果你需要获取文字的坐标信息，可以将 Tesseract for C# 与其他图像处理库（如 OpenCV）结合使用，先使用其他库获取文字在原始图像中的位置信息，再将这些位置信息传递给 Tesseract for C# 进行 OCR 识别，最终得到每个文字的坐标和识别结果。另外，Tesseract for C# 提供了一个 `ResultIterator` 类，可以用于遍历识别结果中的每个单词或字符，并获取它们的坐标信息。以下是一个示例代码： ```csharp var engine = new TesseractEngine(@"path\to\tessdata", "eng", EngineMode.Default); using (var img = Pix.LoadFromFile(@"path\to\image")) { using (var page = engine.Process(img)) { using (var iter = page.GetIterator()) { iter.Begin(); do { var word = iter.GetText(PageIteratorLevel.Word); if (!string.IsNullOrEmpty(word)) { var bbox = iter.GetBoundingBox(PageIteratorLevel.Word); Console.WriteLine($"Word: {word}, BBox: {bbox.Left},{bbox.Top} - {bbox.Right},{bbox.Bottom}"); } } while (iter.Next(PageIteratorLevel.Word)); } } } ``` 该代码使用 `ResultIterator` 遍历识别结果中的每个单词，并获取它们的文本和坐标信息。需要注意的是，`ResultIterator` 的遍历级别（`PageIteratorLevel`）可以设置为单词、字符等不同级别，对应的坐标信息也会有所不同。

阅读全文