猫狗分类pytorch实现
时间: 2023-10-26 18:08:18 浏览: 83
基于pytorch的猫狗分类
5星 · 资源好评率100%
猫狗分类是一个经典的计算机视觉问题,可以使用PyTorch框架实现。以下是一个简单的猫狗分类器的实现过程。
首先,准备数据集。可以从Kaggle下载猫狗分类数据集(https://www.kaggle.com/c/dogs-vs-cats/data)并解压缩到本地路径。数据集包含训练集和测试集,每个样本都是一张图片,分为猫和狗两类。我们需要将数据集进行处理,将图片转换成PyTorch可以处理的格式。
接下来,我们将使用PyTorch的torchvision模块加载数据集。可以使用如下代码:
```
import torch
import torchvision
import torchvision.transforms as transforms
transform = transforms.Compose(
[transforms.Resize((224, 224)),
transforms.ToTensor(),
transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])])
trainset = torchvision.datasets.ImageFolder(root='./train',
transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32,
shuffle=True, num_workers=2)
testset = torchvision.datasets.ImageFolder(root='./test',
transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32,
shuffle=False, num_workers=2)
classes = ('cat', 'dog')
```
这里使用了transforms模块对图片进行预处理,包括将图片大小调整为224x224,转换成张量,并进行标准化。然后使用ImageFolder加载数据集,并将其包装为DataLoader,可以设置批次大小和线程数量等参数。
接下来,定义模型。我们可以使用预训练的ResNet-18模型,并将其最后一层替换成一个全连接层,输出维度为2(即猫和狗两类)。可以使用如下代码:
```
import torch.nn as nn
import torch.optim as optim
import torchvision.models as models
model = models.resnet18(pretrained=True)
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 2)
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
```
这里使用了ResNet-18模型,将其最后一层fc替换成一个线性层。然后定义损失函数和优化器。可以使用交叉熵作为损失函数,使用随机梯度下降进行优化。
最后,训练模型。可以使用如下代码:
```
for epoch in range(10): # 训练10个epoch
running_loss = 0.0
for i, data in enumerate(trainloader, 0):
inputs, labels = data
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
if i % 100 == 99: # 每100个batch输出一次loss
print('[%d, %5d] loss: %.3f' %
(epoch + 1, i + 1, running_loss / 100))
running_loss = 0.0
print('Finished Training')
```
这里使用了一个简单的训练过程,训练10个epoch,每100个batch输出一次loss值。可以根据需要进行调整。
最后,可以在测试集上对模型进行评估。可以使用如下代码:
```
correct = 0
total = 0
with torch.no_grad():
for data in testloader:
images, labels = data
outputs = model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print('Accuracy of the network on the test images: %d %%' % (
100 * correct / total))
```
这里使用了测试集对模型进行评估,计算出模型的准确率。可以根据需要进行调整。
以上就是一个简单的猫狗分类器的实现过程。可以根据需要进行调整和优化。
阅读全文