pytesseract参数
时间: 2023-11-16 09:22:29 浏览: 122
pytesseract:Python-tesseract是用于python的光学字符识别(OCR)工具
pytesseract是一个OCR(Optical Character Recognition,光学字符识别)库,可以识别图片中的文字。它有一些常用的参数,包括:
- lang:指定识别的语言,默认是英语。可以使用多种语言,比如lang='chi_sim'表示中文简体。
- config:指定识别的配置,可以是一个字符串或列表。比如config='--psm 6'表示使用Page Segmentation Mode 6,config=['-c', 'tessedit_char_whitelist=0123456789']表示只识别数字。
- psm:指定Page Segmentation Mode,可以是一个整数或字符串。比如psm=6表示使用Page Segmentation Mode 6,psm='6'也是可以的。Page Segmentation Mode是一种将图片分割成文本块的方式。
更多参数可以参考pytesseract的官方文档。
阅读全文