pytesseract用法
时间: 2023-12-31 20:23:14 浏览: 126
pytesseract
5星 · 资源好评率100%
pytesseract是一个Python的OCR库,可以识别图片中的文字。以下是pytesseract的基本用法:
1.安装pytesseract库和Tesseract OCR引擎
```shell
pip install pytesseract
```
2.导入pytesseract库
```python
import pytesseract
```
3.使用pytesseract库识别图片中的文字
```python
from PIL import Image
# 打开图片
image = Image.open('example.png')
# 识别图片中的文字
text = pytesseract.image_to_string(image, lang='eng')
# 输出识别结果
print(text)
```
其中,`image_to_string`函数是pytesseract库中用于识别图片中文字的函数,`lang`参数指定了识别的语言,默认为英语。
另外,如果你的Tesseract OCR引擎安装在非默认路径下,可以按照以下两种方法指定tesseract_cmd命令的位置:
1.在代码中加入以下代码,指明tesseract_cmd命令的位置,方便pytesseract调用:
```python
tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'
pytesseract.pytesseract.tesseract_cmd = tesseract_cmd
```
2.在pytesseract.py脚本中更改tesseract_cmd路径为tesseract安装路径(根据自己本机的安装路径去写),要具体到tesseract.exe文件,但是不用写.exe这个后缀。
阅读全文