pytesseract 有哪些参数
时间: 2024-07-01 14:01:00 浏览: 164
pytesseract:Python-tesseract是用于python的光学字符识别(OCR)工具
PyTesseract 是一个 Python 库,用于将图像中的文本转换为可编辑的字符串,通常与 Tesseract OCR(Optical Character Recognition,光学字符识别)引擎结合使用。它提供了方便的接口来处理光学字符识别任务。以下是一些常见的 PyTesseract 参数:
1. `image_path` 或 `image`: 必需,指定待识别图像的路径或文件对象。
2. `lang` 或 `language`: 语言代码,用于设置要识别的语言,默认值通常是 'eng' (英语)。可以指定多个语言,用 "+" 分隔。
3. `config` 或 `custom_config`: 配置选项,可以自定义 Tesseract 的行为。例如,`--psm 7` 可以设置页面分割模式(Page Segmentation Mode)。
4. `oem`: Tesseract OCR 使用的引擎模型,支持 `OEM_TESSERACT` (0) 和 `OEM_LSTM` (1)。默认使用 LSTM 引擎。
5. `psm`: 页面分割模式,控制 OCR 对图像区域的处理方式。
6. `debug` 或 `logger_level`: 输出调试信息,如设置为 `True` 或 `'INFO'` 可以看到更详细的 logs。
7. `boxes` 或 `box_output`: 是否返回文字区域的边界框信息,默认不返回。
8. `output_type`: 结果类型,可以选择 `OUTPUT_TEXT`、`OUTPUT_DATA`(二进制数据)或 `OUTPUT_RAW`(原始识别结果)。
9. `strip_accents` 或 `remove_spaces`: 控制是否移除识别出的文本中的重音符号或空格。
10. `threshold` 或 `min_confidence`: 设置识别字符的最小置信度阈值,低于该阈值的结果会被忽略。
阅读全文