pytorch和python实现人脸口罩检测系统,要求能用电脑前置摄像头检测训练结果,请给出包括CNN训练模型的完整代码并提供数据集。
时间: 2024-02-09 22:07:19 浏览: 193
好的,以下是基于PyTorch和OpenCV的人脸口罩检测系统的完整代码(包括CNN训练模型和数据集):
1. 数据集准备
我们使用的数据集是由 Prajna Bhandary 收集和整理的人脸口罩数据集,其中包含了超过 10000 张带有口罩和无口罩标签的人脸图像。数据集可以从以下链接下载:https://www.kaggle.com/prithwirajmitra/covid-face-mask-detection-dataset。
下载完成后,需要将数据集解压并将其放入一个名为 `data` 的文件夹中。`data` 文件夹中应当包含两个子文件夹 `with_mask` 和 `without_mask`,分别存放带有口罩和无口罩的人脸图像。
2. 训练模型
接下来,我们使用 PyTorch 实现一个简单的 CNN 模型,用于训练口罩检测器。
```python
import torch.nn as nn
class MaskDetector(nn.Module):
def __init__(self):
super().__init__()
self.conv1 = nn.Conv2d(3, 32, 3, padding=1)
self.bn1 = nn.BatchNorm2d(32)
self.relu1 = nn.ReLU()
self.pool1 = nn.MaxPool2d(2)
self.conv2 = nn.Conv2d(32, 64, 3, padding=1)
self.bn2 = nn.BatchNorm2d(64)
self.relu2 = nn.ReLU()
self.pool2 = nn.MaxPool2d(2)
self.conv3 = nn.Conv2d(64, 128, 3, padding=1)
self.bn3 = nn.BatchNorm2d(128)
self.relu3 = nn.ReLU()
self.pool3 = nn.MaxPool2d(2)
self.fc1 = nn.Linear(128 * 28 * 28, 512)
self.relu4 = nn.ReLU()
self.dropout1 = nn.Dropout(0.5)
self.fc2 = nn.Linear(512, 1)
self.sigmoid = nn.Sigmoid()
def forward(self, x):
x = self.conv1(x)
x = self.bn1(x)
x = self.relu1(x)
x = self.pool1(x)
x = self.conv2(x)
x = self.bn2(x)
x = self.relu2(x)
x = self.pool2(x)
x = self.conv3(x)
x = self.bn3(x)
x = self.relu3(x)
x = self.pool3(x)
x = x.view(-1, 128 * 28 * 28)
x = self.fc1(x)
x = self.relu4(x)
x = self.dropout1(x)
x = self.fc2(x)
x = self.sigmoid(x)
return x
```
然后,我们可以使用以下代码进行模型训练:
```python
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import os
import cv2
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
# 定义数据预处理方法
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Resize((224, 224)),
transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])
# 定义数据集类
class MaskDataset(Dataset):
def __init__(self, data_dir):
self.data_dir = data_dir
self.img_paths = []
self.labels = []
for label in os.listdir(data_dir):
for img_name in os.listdir(os.path.join(data_dir, label)):
self.img_paths.append(os.path.join(data_dir, label, img_name))
self.labels.append(label)
def __getitem__(self, index):
img_path = self.img_paths[index]
label = self.labels[index]
# 读取图像
img = cv2.imread(img_path)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# 数据预处理
img = transform(img)
label = 1 if label == 'with_mask' else 0
return img, label
def __len__(self):
return len(self.img_paths)
# 加载数据集
train_dataset = MaskDataset('data')
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
# 加载模型
model = MaskDetector()
# 定义损失函数和优化器
criterion = nn.BCELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
# 训练模型
device = 'cuda' if torch.cuda.is_available() else 'cpu'
model.to(device)
for epoch in range(10):
for i, (inputs, labels) in enumerate(train_loader):
inputs = inputs.to(device)
labels = labels.float().to(device)
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels.unsqueeze(1))
loss.backward()
optimizer.step()
if (i+1) % 50 == 0:
print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
.format(epoch+1, 10, i+1, len(train_loader), loss.item()))
# 保存模型
torch.save(model.state_dict(), 'model.pth')
```
在训练过程中,我们使用了 Adam 优化器和二元交叉熵损失函数。训练完毕后,模型会被保存到当前目录下的 `model.pth` 文件中。
3. 测试模型
最后,我们可以使用以下代码测试模型,实现人脸口罩检测系统。
```python
import torch
import cv2
import numpy as np
from models import MaskDetector
# 加载模型
model = MaskDetector()
model.load_state_dict(torch.load('model.pth'))
model.eval()
# 加载人脸检测器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
# 打开摄像头
cap = cv2.VideoCapture(0)
while True:
# 读取一帧图像
ret, frame = cap.read()
# 转为灰度图像
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 人脸检测
faces = face_cascade.detectMultiScale(gray, 1.3, 5)
# 对每个人脸进行口罩检测
for (x, y, w, h) in faces:
# 剪裁出人脸
face = frame[y:y+h, x:x+w]
# 缩放到模型输入尺寸
face = cv2.resize(face, (224, 224))
# 转为PyTorch的张量格式
face = torch.from_numpy(face).permute(2, 0, 1).float().div(255).unsqueeze(0)
# 预测结果
with torch.no_grad():
pred = torch.sigmoid(model(face))
mask_prob = pred.item()
mask_label = 'Mask' if mask_prob > 0.5 else 'No Mask'
# 在图像上绘制结果
color = (0, 255, 0) if mask_prob > 0.5 else (0, 0, 255)
cv2.rectangle(frame, (x, y), (x+w, y+h), color, 2)
cv2.putText(frame, mask_label, (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, color, 2)
# 显示图像
cv2.imshow('Mask Detector', frame)
# 按下q键退出程序
if cv2.waitKey(1) == ord('q'):
break
# 释放摄像头
cap.release()
cv2.destroyAllWindows()
```
在测试过程中,我们使用了 OpenCV 中的人脸检测器对摄像头采集的图像进行人脸检测,然后对每个检测到的人脸进行口罩检测,并在图像上绘制检测结果。
阅读全文