使用chinese-mnist数据集对中文手写数字进行图像识别。其中chinese-mnist数据集包括data文件夹以及chinese-mnist.csv,在文件data中有15000张图片,在图片预处理中,将图片大小改为150*150 并转换为三通道图片,再划分测试集和训练集,其比例为2:8 。并创建CNN神经网络模型,再模型编译包括优化器,loss函数,模型性能,再进行模型训练包含训练集,展示过程 跑多少轮,精度。最后进行图像识别
时间: 2024-03-26 12:34:26 浏览: 102
ChineseMnist KNN中文手写字识别 15000张数据集
5星 · 资源好评率100%
好的,让我来逐步回答你的问题:
1. 图片预处理
首先,你需要导入必要的库,如下所示:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import cv2
import random
from sklearn.model_selection import train_test_split
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
```
然后,你需要读取csv文件,并将图片路径和标签提取出来,如下所示:
```python
# 读取csv文件
data = pd.read_csv('chinese-mnist.csv')
# 提取图片路径和标签
img_paths = data['path'].values
labels = data['label'].values
```
接下来,你需要将图片尺寸调整为150*150,并转换为三通道图片,如下所示:
```python
# 将图片尺寸调整为150*150,并转换为三通道图片
def preprocess_img(img_path):
img = cv2.imread(img_path)
img = cv2.resize(img, (150, 150))
img = cv2.cvtColor(img, cv2.COLOR_GRAY2RGB)
return img
# 处理所有图片
X = []
for img_path in img_paths:
img = preprocess_img('data/' + img_path)
X.append(img)
X = np.array(X)
```
最后,你需要将数据集划分为测试集和训练集,其比例为2:8,如下所示:
```python
# 将数据集划分为测试集和训练集
X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.2, random_state=42)
```
2. 创建CNN神经网络模型
接下来,你需要创建一个CNN神经网络模型。这里我们采用了4层卷积层和3层全连接层,如下所示:
```python
# 创建CNN神经网络模型
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(150, 150, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(256, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(15, activation='softmax'))
```
3. 模型编译
接下来,你需要编译模型,包括优化器、loss函数和模型性能。这里我们采用了Adam优化器和交叉熵损失函数,如下所示:
```python
# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
```
4. 模型训练
接下来,你需要训练模型,包括训练集、展示过程、跑多少轮和精度。这里我们采用了50个epochs,如下所示:
```python
# 将标签转换为one-hot编码
y_train = to_categorical(y_train, num_classes=15)
y_test = to_categorical(y_test, num_classes=15)
# 训练模型
history = model.fit(X_train, y_train, batch_size=32, epochs=50, validation_data=(X_test, y_test))
# 绘制训练过程中的loss和accuracy曲线
plt.plot(history.history['loss'], label='train_loss')
plt.plot(history.history['val_loss'], label='val_loss')
plt.plot(history.history['accuracy'], label='train_acc')
plt.plot(history.history['val_accuracy'], label='val_acc')
plt.legend()
plt.show()
# 在测试集上评估模型精度
test_loss, test_acc = model.evaluate(X_test, y_test)
print('Test Accuracy: {:.2f}%'.format(test_acc * 100))
```
5. 图像识别
最后,你可以用训练好的模型进行图像识别。你需要将输入的图像预处理成与训练集相同的格式,然后用训练好的模型进行预测,如下所示:
```python
# 定义标签
label_dict = {
0: '零', 1: '一', 2: '二', 3: '三', 4: '四',
5: '五', 6: '六', 7: '七', 8: '八', 9: '九',
10: '十', 11: '百', 12: '千', 13: '万', 14: '亿'
}
# 预处理输入的图像
def preprocess_input(img_path):
img = cv2.imread(img_path)
img = cv2.resize(img, (150, 150))
img = cv2.cvtColor(img, cv2.COLOR_GRAY2RGB)
img = np.expand_dims(img, axis=0)
return img
# 加载训练好的模型
model = load_model('model.h5')
# 进行图像识别
img = preprocess_input('test.png')
pred = model.predict(img)
pred_label = label_dict[np.argmax(pred)]
print('Predicted Label: {}'.format(pred_label))
```
这样,你就可以对中文手写数字进行图像识别了。
阅读全文