pytesseract识别汉字代码示范
时间: 2023-07-24 14:50:33 浏览: 113
python下调用pytesseract识别某网站验证码的实现方法
以下是一个简单的Python代码示例,演示如何使用pytesseract识别中文文本:
```python
import pytesseract
from PIL import Image
# 指定 tesseract 所在路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
# 打开图片并进行识别
img = Image.open('chinese_text.png')
text = pytesseract.image_to_string(img, lang='chi_sim')
# 输出识别结果
print(text)
```
在这个示例中,我们首先需要通过 `pytesseract.pytesseract.tesseract_cmd` 指定tesseract可执行文件所在的路径(这里是Windows下的默认安装路径)。然后,我们使用Pillow库打开一张包含中文文本的图片,然后使用 `pytesseract.image_to_string` 函数进行识别,指定语言为中文(`chi_sim`)。最后,将识别结果输出到控制台。
阅读全文