基于pytouch使用alexnet完成猫种类识别算法
时间: 2023-12-30 15:05:02 浏览: 34
好的,以下是基于 PyTorch 实现的 AlexNet 猫种类识别算法的代码:
```python
import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
# 定义超参数
num_epochs = 10
batch_size = 4
learning_rate = 0.001
# 定义数据预处理
transform = transforms.Compose([transforms.Resize((224, 224)),
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
# 加载数据
train_dataset = torchvision.datasets.ImageFolder(root='train/', transform=transform)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_dataset = torchvision.datasets.ImageFolder(root='test/', transform=transform)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)
# 定义模型
class AlexNet(nn.Module):
def __init__(self, num_classes=3):
super(AlexNet, self).__init__()
self.features = nn.Sequential(
nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(64, 192, kernel_size=5, padding=2),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(192, 384, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.Conv2d(384, 256, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.Conv2d(256, 256, kernel_size=3, padding=1),
nn.ReLU(inplace=True),
nn.MaxPool2d(kernel_size=3, stride=2),
)
self.avgpool = nn.AdaptiveAvgPool2d((6, 6))
self.classifier = nn.Sequential(
nn.Dropout(),
nn.Linear(256 * 6 * 6, 4096),
nn.ReLU(inplace=True),
nn.Dropout(),
nn.Linear(4096, 4096),
nn.ReLU(inplace=True),
nn.Linear(4096, num_classes),
)
def forward(self, x):
x = self.features(x)
x = self.avgpool(x)
x = torch.flatten(x, 1)
x = self.classifier(x)
return x
# 实例化模型和损失函数
model = AlexNet(num_classes=3)
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
for i, (images, labels) in enumerate(train_loader):
# 前向传播
outputs = model(images)
loss = criterion(outputs, labels)
# 反向传播和优化
optimizer.zero_grad()
loss.backward()
optimizer.step()
if (i + 1) % 100 == 0:
print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, i + 1, total_step, loss.item()))
# 测试模型
model.eval()
with torch.no_grad():
correct = 0
total = 0
for images, labels in test_loader:
outputs = model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print('Test Accuracy of the model on the test images: {} %'.format(100 * correct / total))
```
在代码中,我们首先定义了超参数,包括训练轮数、批次大小和学习率等。
然后,我们定义了数据预处理,将图片 resize 到 224x224 的大小,并进行正则化。
接下来,我们使用 `ImageFolder` 类加载数据集,然后通过 `DataLoader` 类将数据集分为小批次进行训练。
我们的模型是 AlexNet,通过 `nn.Sequential` 将卷积层和全连接层组成网络。在模型训练过程中,我们使用交叉熵损失函数和 Adam 优化器。
最后,我们对模型进行测试,计算出模型在测试集上的准确率。
请注意,这只是一个简单的示例,如果你要在实际应用中使用这个模型,还需要对其进行优化,比如通过调整超参数、使用更复杂的网络结构、使用数据增强等方法来提高模型的性能。