OCR识别用Python怎么写
时间: 2024-10-12 07:16:03 浏览: 39
OCR(Optical Character Recognition,光学字符识别)技术用于从图像或扫描文档中自动识别文本。在Python中,可以使用一些开源库来实现OCR功能,如Tesseract、PyTesseract和EasyOCR等。以下是使用PyTesseract的一个简单示例:
首先,你需要安装`pytesseract`及其依赖`google-tesseract`。在命令行中运行以下命令:
```bash
pip install pytesseract opencv-python pillow
```
然后,你可以编写一个Python脚本来读取图片并进行OCR识别,例如:
```python
import cv2
from PIL import Image
import pytesseract
# 加载图像
img_path = 'image.jpg'
image = cv2.imread(img_path)
# 转换为灰度图,有时这有助于提高识别效果
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 对图像进行二值化处理
thresh = cv2.threshold(gray_image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
# 使用pytesseract进行识别
text = pytesseract.image_to_string(Image.fromarray(thresh), lang='chi_sim') # 中文识别语言设置为'sim'或'cht'
print("识别出的文字:", text)
```
在这个例子中,我们首先读取图像,将其转换为灰度,然后进行二值化处理以增强字符边缘。接着,通过`pytesseract.image_to_string`函数识别出文字,并将结果打印出来。
阅读全文