Python实现批量识别图片文字并输出
时间: 2024-09-24 16:27:49 浏览: 58
在Python中,你可以利用Tesseract OCR(Optical Character Recognition,光学字符识别)库和PIL(Python Imaging Library)等工具来实现批量图片文字识别。以下是一个简化的步骤:
1. 安装必要的库:
- 首先,你需要安装`pytesseract`(Tesseract接口),可以通过pip安装:
```
pip install pytesseract
```
- 对于图像处理,可以使用`Pillow`(PIL的分支),如果还没安装:
```
pip install Pillow
```
2. 导入所需模块:
```python
import os
from PIL import Image
import pytesseract
```
3. 设置Tesseract路径(如果你的Tesseract不在默认路径下):
```python
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
```
4. 批量处理图片:
创建一个函数,接受图片文件路径作为输入,然后读取、处理和识别文本:
```python
def recognize_text(image_path):
with Image.open(image_path) as img:
text = pytesseract.image_to_string(img)
return text
```
5. 循环遍历图片目录,调用上述函数识别每个图片的文字:
```python
input_dir = 'path/to/your/image/folder'
for filename in os.listdir(input_dir):
if filename.endswith('.jpg') or filename.endswith('.png'): # 可视化修改为你需要识别的图片类型
image_path = os.path.join(input_dir, filename)
recognized_text = recognize_text(image_path)
print(f"File {filename}: {recognized_text}")
```
6. 跑这个脚本,它会打印出每张图片的内容。
**
阅读全文