digits = cv2.imread('digits.png', 0) rows, cols = np.hsplit(digits, 100) cells = [np.hsplit(row, 50) for row in rows] train_data = np.array(cells).reshape(-1, 400).astype(np.float32) train_labels = np.repeat(np.arange(10), len(train_data) / 10)
时间: 2023-06-08 12:06:02 浏览: 91
这段代码看起来是在做什么?
它是在加载一个包含数字图像的 png 文件,并将每个数字图像分别分割为 50x20 个小单元格。然后,这些小单元格被重新排列成一个数组,其中每个数字被转换为一个 400 维的特征向量,用于训练机器学习模型。每个数字的标签随后被重复多次,并用于训练模型的分类任务。
相关问题
import cv2 import numpy as np import matplotlib.pyplot as plt gray = cv2.imread('digits.png', 0) digits = [np.hsplit(r, 100) for r in np.vsplit(gray, 50)] # 分解数字:50行,100列 np_digits = np.array(digits) # 转换为numpy数组 # 准备训练数据,转换为二维数组,每个图像400个像素 train_data = np_digits.reshape(-1, 400).astype(np.float32) train_labels = np.repeat(np.arange(10), 500)[:, np.newaxis] # 定义标志 knn = cv2.ml.KNearest_create() # 创建kNN分类器 knn.train(train_data, cv2.ml.ROW_SAMPLE, train_labels) # 训练模型 # 用绘图工具创建手写数字5图像(大小20x20)进行测试(黑白二值图像) test = cv2.imread('d5.png', 0) # 打开测试图像 test = cv2.resize(test, (20, 20)) # 转换为20x20大小 test_data = test.reshape(1, 400).astype(np.float32) # 转换为测试数据 ret, result, neighbours, dist = knn.findNearest(test_data, k=3) # 执行测试 print(result.ravel()) print(neighbours.ravel()) # 拍摄图像数字3,进行测试(非黑白二值图像) img2 = cv2.imread('d3.png', 0) img2 = cv2.resize(img2, (20, 20)) ret, img2 = cv2.threshold(img2, 150, 255, cv2.THRESH_BINARY_INV) # 反二值化阈值处理 test_data = img2.reshape(1, 400).astype(np.float32) # 转换为测试数据 ret, result, neighbours, dist = knn.findNearest(test_data, k=3) # 执行测试 print(result.ravel()) print(neighbours.ravel()) 以上代码怎么优化
下面是对代码的一些优化建议:
1. 使用 with 语句打开文件:在读取图片时,最好使用 with 语句打开文件,这样可以确保文件在使用后被正确关闭,也可以避免一些意外情况下的错误。
2. 使用 reshape 的 -1 参数:在将 digits 转换为 numpy 数组时,可以使用 reshape 函数的 -1 参数,这样 numpy 将自动计算数组的大小。
3. 使用 ravel 替换 flatten:在将结果打印出来时,可以使用 ravel 函数替换 flatten 函数,因为 ravel 函数返回的是一个视图,而不是一个副本,因此更加高效。
4. 优化二值化处理:在对测试图像进行二值化处理时,可以使用 adaptiveThreshold 函数来自适应地进行阈值处理,这比使用固定的阈值要更加准确。
5. 使用 plt.imshow 显示图像:在显示图像时,可以使用 plt.imshow 函数,这样可以更加方便地进行调整和处理。
6. 添加注释:在代码中添加注释,可以帮助其他人更好地理解代码的含义和作用。
下面是优化后的代码:
```
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 打开文件并读取灰度图像
with open('digits.png', 'rb') as f:
gray = cv2.imdecode(np.frombuffer(f.read(), np.uint8), cv2.IMREAD_GRAYSCALE)
# 分解数字:50行,100列
digits = np.hsplit(np.vstack(np.hsplit(gray, 100)), 50)
# 转换为numpy数组
np_digits = np.array(digits)
# 转换为二维数组,每个图像400个像素
train_data = np_digits.reshape(-1, 400).astype(np.float32)
# 定义标志
train_labels = np.repeat(np.arange(10), 500)[:, np.newaxis]
# 创建kNN分类器
knn = cv2.ml.KNearest_create()
# 训练模型
knn.train(train_data, cv2.ml.ROW_SAMPLE, train_labels)
# 用绘图工具创建手写数字5图像(大小20x20)进行测试(黑白二值图像)
test = cv2.imread('d5.png', cv2.IMREAD_GRAYSCALE)
# 转换为20x20大小
test = cv2.resize(test, (20, 20))
# 自适应阈值二值化处理
test = cv2.adaptiveThreshold(test, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 11, 2)
# 转换为测试数据
test_data = test.reshape(1, 400).astype(np.float32)
# 执行测试
ret, result, neighbours, dist = knn.findNearest(test_data, k=3)
# 打印测试结果
print(result.ravel())
print(neighbours.ravel())
# 拍摄图像数字3,进行测试(非黑白二值图像)
img2 = cv2.imread('d3.png', cv2.IMREAD_GRAYSCALE)
# 转换为20x20大小
img2 = cv2.resize(img2, (20, 20))
# 自适应阈值二值化处理
img2 = cv2.adaptiveThreshold(img2, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 11, 2)
# 转换为测试数据
test_data = img2.reshape(1, 400).astype(np.float32)
# 执行测试
ret, result, neighbours, dist = knn.findNearest(test_data, k=3)
# 打印测试结果
print(result.ravel())
print(neighbours.ravel())
# 显示测试图像
plt.imshow(test, cmap='gray')
plt.show()
# 显示训练图像
plt.imshow(gray, cmap='gray')
plt.show()
```
import cv2 import numpy as np def hog(img): hog = cv2.HOGDescriptor((20,20),(8,8), (4,4),(8,8),9,1,-1,0,0.2,1,64,True) hog_descriptor=hog.compute(img) hog_descriptor=np.squeeze(hog_descriptor) return hog_descriptor img = cv2.imread((r'C:\Users\Administrator\Pictures\Camera Roll\8.png',0) digits=[np.hsplit(row,100) for row in np.vsplit(img,50)] labels = np.repeat(np.arange(10),500)[:,np.newaxis] hogdata = [list(map(hog,row)) for row in digits] trainData = np.float32(hogdata).reshape(-1,144) svm = cv2.ml.SVM_create() #设置相关参数 svm.setKernel(cv2.ml.SVM_LINEAR) svm.setType(cv2.ml.SVM_C_SVC) svm.setC(2.67) svm.setGamma(5.383) svm.train(trainData, cv2.ml.ROW_SAMPLE, labels) #训练模型 #用绘图工具创建的手写数字5图像(大小为20*20)进行测试 test= cv2.imread(r'C:\Users\Administrator\Pictures\Camera Roll\6.png') #打开图像test_data=hog(test) test_data=test_data.reshape(1,144).astype(np.float32) result = svm.predict(test_data)[1] print('识别结果:',np.squeeze(result)) #用绘图工具创建的手写数字8图像(大小为20*20)进行测试 test= cv2.imread('d8.jpg',0) test_data=hog(test) test_data=test_data.reshape(1,144).astype(np.float32) #转换为测试数据 result = svm.predict(test_data)[1] print('识别结果:',np.squeeze(result))纠正代码
在您提供的代码中,有以下几处需要纠正的错误:
1. 第一行 `import cv2 import numpy as np` 应该改为两行代码:
```
import cv2
import numpy as np
```
2. 第二行 `def hog(img):` 后面应该加上缩进。
3. 第三行 `hog = cv2.HOGDescriptor((20,20),(8,8), (4,4),(8,8),9,1,-1,0,0.2,1,64,True)`,其中参数的数量和顺序不对,应该改为:
```
hog = cv2.HOGDescriptor((20,20),(8,8),(4,4),(8,8),9,1,-1,0,0.2,True,64)
```
4. 第四行 `hog_descriptor=hog.compute(img)`,缺少一个括号,应该改为:
```
hog_descriptor=hog.compute(img)
```
5. 第五行 `hog_descriptor=np.squeeze(hog_descriptor)`,该行代码不需要缩进。
6. 第七行 `img = cv2.imread((r'C:\Users\Administrator\Pictures\Camera Roll\8.png',0)`,`cv2.imread` 函数中的路径需要加上一个括号,应该改为:
```
img = cv2.imread(r'C:\Users\Administrator\Pictures\Camera Roll\8.png',0)
```
7. 第八行 `digits=[np.hsplit(row,100) for row in np.vsplit(img,50)]`,该行代码不需要缩进。
8. 第九行 `labels = np.repeat(np.arange(10),500)[:,np.newaxis]`,该行代码不需要缩进。
9. 第十行 `hogdata = [list(map(hog,row)) for row in digits]`,该行代码不需要缩进。
10. 第十一行 `trainData = np.float32(hogdata).reshape(-1,144)`,该行代码不需要缩进。
11. 第十二行 `svm = cv2.ml.SVM_create() #设置相关参数`,该行代码不需要缩进。
12. 第十三行 `svm.setKernel(cv2.ml.SVM_LINEAR) svm.setType(cv2.ml.SVM_C_SVC) svm.setC(2.67) svm.setGamma(5.383) svm.train(trainData, cv2.ml.ROW_SAMPLE, labels)`,该行代码中的多个函数调用应该分别放在一行,且需要缩进。
13. 第十五行 `test= cv2.imread(r'C:\Users\Administrator\Pictures\Camera Roll\6.png')`,该行代码不需要缩进。
14. 第十六行 `test_data=hog(test) test_data=test_data.reshape(1,144).astype(np.float32)`,该行代码中的两个函数调用应该分别放在一行,且需要缩进。
15. 第十七行 `result = svm.predict(test_data)[1]`,该行代码不需要缩进。
16. 第十八行 `print('识别结果:',np.squeeze(result))`,该行代码不需要缩进。
17. 第二十行 `test= cv2.imread('d8.jpg',0)`,该行代码不需要缩进。
18. 第二十一行 `test_data=hog(test) test_data=test_data.reshape(1,144).astype(np.float32)`,该行代码中的两个函数调用应该分别放在一行,且需要缩进。
19. 第二十二行 `result = svm.predict(test_data)[1]`,该行代码不需要缩进。
20. 第二十三行 `print('识别结果:',np.squeeze(result))`,该行代码不需要缩进。
纠正后的代码如下所示:
```
import cv2
import numpy as np
def hog(img):
hog = cv2.HOGDescriptor((20,20),(8,8),(4,4),(8,8),9,1,-1,0,0.2,True,64)
hog_descriptor=hog.compute(img)
hog_descriptor=np.squeeze(hog_descriptor)
return hog_descriptor
img = cv2.imread(r'C:\Users\Administrator\Pictures\Camera Roll\8.png',0)
digits=[np.hsplit(row,100) for row in np.vsplit(img,50)]
labels = np.repeat(np.arange(10),500)[:,np.newaxis]
hogdata = [list(map(hog,row)) for row in digits]
trainData = np.float32(hogdata).reshape(-1,144)
svm = cv2.ml.SVM_create()
svm.setKernel(cv2.ml.SVM_LINEAR)
svm.setType(cv2.ml.SVM_C_SVC)
svm.setC(2.67)
svm.setGamma(5.383)
svm.train(trainData, cv2.ml.ROW_SAMPLE, labels)
test= cv2.imread(r'C:\Users\Administrator\Pictures\Camera Roll\6.png',0)
test_data=hog(test)
test_data=test_data.reshape(1,144).astype(np.float32)
result = svm.predict(test_data)[1]
print('识别结果:',np.squeeze(result))
test= cv2.imread('d8.jpg',0)
test_data=hog(test)
test_data=test_data.reshape(1,144).astype(np.float32)
result = svm.predict(test_data)[1]
print('识别结果:',np.squeeze(result))
```
阅读全文