首页pytesseract 有哪些参数

pytesseract 有哪些参数

时间: 2024-07-01 19:01:00 浏览: 170

pytesseract:Python-tesseract是用于python的光学字符识别（OCR）工具

Python Tesseract Python-tesseract是用于python的光学字符识别（OCR）工具。也就是说，它将识别并“读取”图像中嵌入的文本。 Python-tesseract是的包装。它也可以用作tesseract的独立调用脚本，因为它可以读取Python Imaging Library支持的所有图像类型，包括jpeg，png，gif，bmp，tiff等，而默认情况下，tesseract-ocr仅支持tiff和bmp。此外，如果将Python-tesseract用作脚本，它将打印识别出的文本，而不是将其写入文件。用法快速开始 try : import Image except ImportError : from PIL import Image import pytesseract # If you don't have tessera

PyTesseract 是一个 Python 库，用于将图像中的文本转换为可编辑的字符串，通常与 Tesseract OCR（Optical Character Recognition，光学字符识别）引擎结合使用。它提供了方便的接口来处理光学字符识别任务。以下是一些常见的 PyTesseract 参数： 1. `image_path` 或 `image`: 必需，指定待识别图像的路径或文件对象。 2. `lang` 或 `language`: 语言代码，用于设置要识别的语言，默认值通常是 'eng' (英语)。可以指定多个语言，用 "+" 分隔。 3. `config` 或 `custom_config`: 配置选项，可以自定义 Tesseract 的行为。例如，`--psm 7` 可以设置页面分割模式（Page Segmentation Mode）。 4. `oem`: Tesseract OCR 使用的引擎模型，支持 `OEM_TESSERACT` (0) 和 `OEM_LSTM` (1)。默认使用 LSTM 引擎。 5. `psm`: 页面分割模式，控制 OCR 对图像区域的处理方式。 6. `debug` 或 `logger_level`: 输出调试信息，如设置为 `True` 或 `'INFO'` 可以看到更详细的 logs。 7. `boxes` 或 `box_output`: 是否返回文字区域的边界框信息，默认不返回。 8. `output_type`: 结果类型，可以选择 `OUTPUT_TEXT`、`OUTPUT_DATA`（二进制数据）或 `OUTPUT_RAW`（原始识别结果）。 9. `strip_accents` 或 `remove_spaces`: 控制是否移除识别出的文本中的重音符号或空格。 10. `threshold` 或 `min_confidence`: 设置识别字符的最小置信度阈值，低于该阈值的结果会被忽略。

阅读全文