pytesseract api文档
时间: 2023-11-27 11:44:45 浏览: 110
pytesseract是一个Python的OCR库,可以识别图片中的文字。它使用Tesseract作为后端引擎,支持多种语言。以下是pytesseract的API文档:
1. pytesseract.image_to_string(image, lang=None, config='', nice=0, output_type=Output.STRING, timeout=0, pandas_config=None):将图片转换为字符串。
参数:
- image: PIL.Image对象或文件路径。
- lang: 语言,默认为None,表示自动检测语言。
- config: Tesseract配置参数,可以是字符串或列表。
- nice: 进程优先级,默认为0。
- output_type: 输出类型,默认为Output.STRING,可以是Output.DICT、Output.BYTES或Output.DATAPATH。
- timeout: 超时时间,默认为0,表示无限制。
- pandas_config: pandas配置参数。
返回值:识别结果。
2. pytesseract.image_to_boxes(image, lang=None, config='', nice=0, output_type=Output.STRING, timeout=0, pandas_config=None):将图片转换为字符框。
参数和返回值同上。
3. pytesseract.image_to_data(image, lang=None, config='', nice=0, output_type=Output.STRING, timeout=0, pandas_config=None):将图片转换为字符数据。
参数和返回值同上。
4. pytesseract.image_to_osd(image, lang=None, config='', nice=0, timeout=0):将图片转换为方向和脚本检测结果。
参数:
- image: PIL.Image对象或文件路径。
- lang: 语言,默认为None,表示自动检测语言。
- config: Tesseract配置参数,可以是字符串或列表。
- nice: 进程优先级,默认为0。
- timeout: 超时时间,默认为0,表示无限制。
返回值:方向和脚本检测结果。
5. pytesseract.run_and_get_output(image_path, extension='txt', lang=None, config='', nice=0, timeout=0):运行Tesseract并获取输出。
参数:
- image_path: 图片路径。
- extension: 输出文件扩展名,默认为txt。
- lang: 语言,默认为None,表示自动检测语言。
- config: Tesseract配置参数,可以是字符串或列表。
- nice: 进程优先级,默认为0。
- timeout: 超时时间,默认为0,表示无限制。
返回值:输出结果。
阅读全文