首页python识别图片文字

python识别图片文字

时间: 2023-09-17 15:07:18 浏览: 157

可以使用Python的OCR库来识别图片中的文字。OCR（Optical Character Recognition）是一种将图像中的文字识别为文本的技术。 Python中常用的OCR库有： 1. pytesseract：基于Google的Tesseract OCR引擎，可以在Windows、Linux和Mac上使用。 2. OCRopus：一个OCR引擎，支持多种语言和字体。 3. Kraken：一个OCR引擎，支持多种语言和字体，尤其适合处理历史文献和手写文本。 4. EasyOCR：一个基于深度学习的OCR库，支持80多种语言，包括中文、日文、韩文等。下面以pytesseract为例，介绍如何使用Python识别图片文字。首先需要安装pytesseract和Pillow库： ```python pip install pytesseract pip install Pillow ``` 然后，安装tesseract OCR引擎。在Windows上，可以从https://github.com/UB-Mannheim/tesseract/wiki下载exe文件进行安装。在Linux上，可以使用以下命令进行安装： ```bash sudo apt-get update sudo apt-get install tesseract-ocr ``` 接下来，可以使用以下代码进行图片文字识别： ```python import pytesseract from PIL import Image # 打开图片 image = Image.open('image.png') # 识别图片中的文字 text = pytesseract.image_to_string(image, lang='eng') print(text) ``` 其中，`lang`参数指定了要识别的语言，这里使用的是英文。如果要识别其他语言，可以将`lang`参数改为相应的缩写。例如，中文为`chi_sim`。上述代码会将图片中的文字识别为字符串，并输出到控制台上。

阅读全文