Python文字识别
时间: 2023-11-05 17:53:19 浏览: 188
Python文字识别是使用Python编程语言进行文字识别的过程。在Python中,可以使用pytesseract库来实现文字识别功能。该库使用tesseract-ocr作为识别引擎,可以从图像中提取文本。下面是一些使用pytesseract库进行文字识别的示例代码:
1. 单张图片识别:
```
import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open("image.png"), lang="eng") # 使用英文识别引擎
print(text)
```
2. 批量图片识别:
```
import os
import pytesseract
path = 'text_img/' # 文字图片的路径
imgs = [path + i for i in os.listdir(path)] # 获取图片路径列表
f = open('text.txt', 'w', encoding='utf-8') # 打开文件
for img in imgs:
f.write(img + '\n') # 将各个图片的路径写入text.txt文件中
f.close()
string = pytesseract.image_to_string('text.txt', lang='chi_sim') # 使用中文识别引擎
print(string)
```
通过上述代码,你可以在Python中实现文字识别功能,将图像中的文本提取出来。其中,你可以根据需要选择不同的识别引擎和语言进行文字识别。
阅读全文