怎样用python识别图像中的数字
时间: 2024-03-01 09:54:16 浏览: 112
可以使用Python中的OpenCV库和NumPy库来识别图像中的数字。下面是一个简单的Python代码示例:
```python
import cv2
import numpy as np
import pytesseract
# 读取图片
img = cv2.imread('image.jpg')
# 将图片转换为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 对图像进行二值化处理
ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
# 查找图像中的轮廓
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 遍历每个轮廓
for contour in contours:
# 计算轮廓的边界框
x, y, w, h = cv2.boundingRect(contour)
# 如果边界框的面积小于一定值,则忽略该轮廓
if w * h < 100:
continue
# 提取数字图像
digit_img = thresh[y:y+h, x:x+w]
# 将数字图像调整为固定大小
digit_img = cv2.resize(digit_img, (28, 28))
# 将数字图像转换为一维数组
digit_array = np.ravel(digit_img)
# 将一维数组转换为二维数组并进行预处理
digit_array = np.array([digit_array])
digit_array = digit_array.astype('float32') / 255
# 加载MNIST训练好的模型
model = keras.models.load_model('mnist_model.h5')
# 预测数字
digit = model.predict_classes(digit_array)[0]
# 在图像中标注数字
cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv2.putText(img, str(digit), (x, y), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
# 显示图像
cv2.imshow('image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
```
上述代码中,首先将原始图像转换为灰度图像,然后使用二值化处理将图像转换为黑白图像。接着使用findContours函数查找图像中的轮廓,对每个轮廓进行处理,提取数字图像并调整为固定大小,然后使用MNIST训练好的模型进行数字识别,最后在原始图像中标注数字并显示。需要注意的是,MNIST训练好的模型需要提前准备好。
阅读全文