用python如何实现图片提取文字
时间: 2023-02-07 16:28:29 浏览: 61
在 Python 中可以使用 OCR 库来实现图片文字提取。推荐使用 pytesseract 库,它是一个使用 Tesseract OCR 引擎的纯 Python 库。
使用方法如下:
1. 安装 pytesseract 库。
```
pip install pytesseract
```
2. 安装 Tesseract OCR 引擎。
在 Windows 上可以直接在以下网址下载安装包进行安装:https://digi.bib.uni-mannheim.de/tesseract/
在 macOS 和 Linux 上可以使用包管理器进行安装:
```
# macOS
brew install tesseract
# Ubuntu
sudo apt-get install tesseract-ocr
```
3. 在 Python 中使用 pytesseract 库进行图片文字提取。
```
import pytesseract
from PIL import Image
# 使用 Image.open() 打开图片文件
image = Image.open('image.jpg')
# 调用 pytesseract.image_to_string() 函数进行图片文字提取
text = pytesseract.image_to_string(image)
print(text)
```
在调用 `pytesseract.image_to_string()` 函数时,还可以传入可选参数 `lang` 指定文字语言,例如 `lang='chi_sim'` 指定文字为简体中文。
希望这些信息能帮到你!
阅读全文