批量图片识别文字python代码
时间: 2023-11-12 12:01:23 浏览: 44
以下是利用Python进行批量图片识别文字的代码:
```
import pytesseract
from PIL import Image
import os
# 设置tesseract文件路径
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# 待识别图片路径
image_folder = "path/to/image/folder"
# 识别结果保存路径
result_folder = "path/to/result/folder"
# 循环处理文件夹中的图片
for filename in os.listdir(image_folder):
if filename.endswith(".png") or filename.endswith(".jpg"):
# 打开图片
img = Image.open(os.path.join(image_folder, filename))
# 识别图片中的文字
text = pytesseract.image_to_string(img, lang='eng')
# 保存识别结果
with open(os.path.join(result_folder, f"{filename}.txt"), "w", encoding="utf-8") as f:
f.write(text)
```
上述代码中,需要设置tesseract文件路径,也就是tesseract.exe文件所在路径。同时需要指定待识别图片路径和识别结果保存路径。循环处理图片时,使用`os.listdir()`函数获取文件夹中的文件名列表,使用`os.path.join()`函数拼接文件路径,打开图片并使用`pytesseract.image_to_string()`函数进行文字识别,最后将识别结果保存到指定路径下的txt文件中。