python ocr 多页
时间: 2023-07-27 11:06:55 浏览: 38
你可以使用Python中的OCR库来实现多页OCR。一个常用的OCR库是Tesseract,它支持多种语言和多页文档识别。下面是一个使用Tesseract进行多页OCR的示例代码:
```python
import pytesseract
from PIL import Image
def ocr_multiple_pages(images):
text = ''
for image in images:
img = Image.open(image)
text += pytesseract.image_to_string(img)
return text
# 传入图片列表
images = ['page1.jpg', 'page2.jpg', 'page3.jpg']
result = ocr_multiple_pages(images)
print(result)
```
在这个示例中,我们首先导入了`pytesseract`和`PIL`库。然后定义了一个`ocr_multiple_pages`函数,它会遍历图片列表,将每一页的图片转换为文本并拼接起来。最后调用该函数并输出结果。
请确保已经安装了Tesseract OCR引擎和pytesseract库。你可以使用以下命令安装依赖项:
```
pip install pytesseract pillow
```
同时,你需要下载并安装Tesseract OCR引擎,具体安装方法请参考Tesseract的官方文档。
希望对你有帮助!如果你有任何其他问题,请随时提问。