对图像进行切分,以形成类似mnist的手写数据集。过程:1)先从图像中切割四个黑点框定的区域;2)从切割的区域中切出每个数字的小片,并将每个小片按照如下的规则进行命名:图像原来的文件名_“行号”_“列号”.jpg
时间: 2024-05-09 12:15:47 浏览: 48
可以使用Python中的OpenCV库来完成对图像的切分,具体实现过程如下:
1. 使用OpenCV读取要切分的图像,并将其转换为灰度图像。
```python
import cv2
# 读取图像并转换为灰度图像
img = cv2.imread('image.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
```
2. 对灰度图像进行二值化处理,将黑色背景和白色数字分离出来。
```python
# 对灰度图像进行二值化处理
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
```
3. 使用形态学操作(膨胀、腐蚀)对二值化图像进行处理,使数字之间的空隙消失,便于后续的轮廓检测。
```python
# 定义结构元素
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
# 对二值化图像进行膨胀操作
dilate = cv2.dilate(thresh, kernel, iterations=2)
# 对膨胀后的图像进行腐蚀操作
erode = cv2.erode(dilate, kernel, iterations=2)
```
4. 使用轮廓检测找到数字的边界,然后根据边界进行切割,并保存切割后的小片。
```python
# 找到轮廓
contours, hierarchy = cv2.findContours(erode, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 遍历轮廓
for i in range(len(contours)):
# 找到数字的边界
x, y, w, h = cv2.boundingRect(contours[i])
# 切割数字小片
digit = erode[y:y+h, x:x+w]
# 保存小片
cv2.imwrite('{}_{}_{}.jpg'.format(filename, i//4, i%4), digit)
```
完整代码如下:
```python
import cv2
# 读取图像并转换为灰度图像
img = cv2.imread('image.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 对灰度图像进行二值化处理
_, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
# 定义结构元素
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
# 对二值化图像进行膨胀操作
dilate = cv2.dilate(thresh, kernel, iterations=2)
# 对膨胀后的图像进行腐蚀操作
erode = cv2.erode(dilate, kernel, iterations=2)
# 找到轮廓
contours, hierarchy = cv2.findContours(erode, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 遍历轮廓
for i in range(len(contours)):
# 找到数字的边界
x, y, w, h = cv2.boundingRect(contours[i])
# 切割数字小片
digit = erode[y:y+h, x:x+w]
# 保存小片
cv2.imwrite('{}_{}_{}.jpg'.format(filename, i//4, i%4), digit)
```
其中,filename指的是原始图像的文件名。切割后的数字小片会按照“行号”和“列号”进行命名,并保存在当前目录下。
阅读全文