pytorch代码在VOC2012数据集上挖掘出某一类中具有频繁性和判别性的图片，挖掘网络使用LeNet,并将挖掘出的图片可视化

好的，这个任务可以分成以下几步来进行： 1. 加载VOC2012数据集并进行预处理 2. 定义LeNet网络结构 3. 对LeNet进行训练，挖掘出具有频繁性和判别性的图片 4. 可视化挖掘出的图片下面我们逐步实现这些步骤。首先需要安装必要的库，包括torch、torchvision、numpy、matplotlib等。可以使用以下命令进行安装： ```python !pip install torch torchvision numpy matplotlib ``` 接下来，我们开始实现第一步，加载VOC2012数据集并进行预处理。我们可以使用torchvision中的datasets模块来加载VOC2012数据集，并通过transforms模块来进行预处理。具体实现如下： ```python import torch import torchvision import torchvision.transforms as transforms # 定义预处理操作 transform = transforms.Compose([ transforms.Resize(32), transforms.CenterCrop(32), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) # 加载训练集和测试集 trainset = torchvision.datasets.VOCSegmentation(root='./data', year='2012', image_set='train', download=True, transform=transform) testset = torchvision.datasets.VOCSegmentation(root='./data', year='2012', image_set='val', download=True, transform=transform) # 创建数据加载器 trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True) testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False) ``` 接下来，我们开始实现第二步，定义LeNet网络结构。LeNet是一个经典的卷积神经网络结构，适合于处理类似MNIST这样的小图像数据。在本任务中，我们将其用于处理VOC2012数据集。具体实现如下： ```python import torch.nn as nn class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool1 = nn.MaxPool2d(2, 2) self.conv2 = nn.Conv2d(6, 16, 5) self.pool2 = nn.MaxPool2d(2, 2) self.fc1 = nn.Linear(16 * 5 * 5, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 20) def forward(self, x): x = self.pool1(torch.relu(self.conv1(x))) x = self.pool2(torch.relu(self.conv2(x))) x = x.view(-1, 16 * 5 * 5) x = torch.relu(self.fc1(x)) x = torch.relu(self.fc2(x)) x = self.fc3(x) return x net = LeNet() ``` 接下来，我们开始实现第三步，对LeNet进行训练，挖掘出具有频繁性和判别性的图片。具体实现如下： ```python import torch.optim as optim criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) for epoch in range(10): running_loss = 0.0 for i, data in enumerate(trainloader, 0): inputs, labels = data optimizer.zero_grad() outputs = net(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() if i % 200 == 199: print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 200)) running_loss = 0.0 print('Finished Training') # 挖掘具有频繁性和判别性的图片 class_freq = [0] * 20 class_correct = [0] * 20 class_total = [0] * 20 for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs, 1) c = (predicted == labels).squeeze() for i in range(len(labels)): label = labels[i] class_freq[label] += 1 class_correct[label] += c[i].item() class_total[label] += 1 freq_threshold = 0.8 disc_threshold = 0.8 freq_imgs = [] disc_imgs = [] for i in range(20): freq_ratio = class_correct[i] / class_freq[i] disc_ratio = class_correct[i] / class_total[i] if freq_ratio > freq_threshold: freq_imgs.append(i) if disc_ratio > disc_threshold: disc_imgs.append(i) print("Frequently accurate classes: ", freq_imgs) print("Discriminative classes: ", disc_imgs) ``` 上述代码中，我们使用交叉熵损失函数和随机梯度下降优化器对LeNet进行训练，训练10个epoch。训练过程中，我们计算每个类别的分类准确率，并根据阈值挖掘出具有频繁性和判别性的图片。最后一步是可视化挖掘出的图片。下面是一个简单的实现： ```python import matplotlib.pyplot as plt import numpy as np def imshow(img): img = img / 2 + 0.5 # unnormalize npimg = img.numpy() plt.imshow(np.transpose(npimg, (1, 2, 0))) # 显示具有频繁性的图片 freq_images = [] for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs, 1) for i in range(len(labels)): if labels[i].item() in freq_imgs: freq_images.append(images[i]) break fig = plt.figure(figsize=(10, 10)) for i in range(len(freq_images)): ax = fig.add_subplot(5, 5, i+1, xticks=[], yticks=[]) imshow(freq_images[i]) plt.show() # 显示具有判别性的图片 disc_images = [] for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs, 1) for i in range(len(labels)): if labels[i].item() in disc_imgs and labels[i].item() == predicted[i].item(): disc_images.append(images[i]) break fig = plt.figure(figsize=(10, 10)) for i in range(len(disc_images)): ax = fig.add_subplot(5, 5, i+1, xticks=[], yticks=[]) imshow(disc_images[i]) plt.show() ``` 上述代码中，我们首先从测试集中挑选出具有频繁性的图片和具有判别性的图片，然后将它们可视化出来。可以通过修改阈值来调整挖掘出的图片数量和质量。

阅读全文

pytorch代码在VOC2012数据集上挖掘出某一类中具有频繁性和判别性的图片，挖掘网络使用LeNet,并将挖掘出的图片可视化

相关推荐

LeNet的pytorch实现

pytorch 数据集图片显示方法

LeNet-5:LeNet-5的PyTorch实施和实时可视化

pytorch实现在VOC2012数据集上的cat类中随机采样图像块，，在图像块中挖掘同时具有判别性和频繁性的一类图片，并将图片可视化，挖掘算法采用LeNet

VGG卷积神经网络图像分类训练Pytorch代码 使用Cifar100数据集

GAN网络生成人脸Pytorch代码 使用CelebA数据集

全卷积网络基于voc2012数据集简单pytorch实现

WGAN生成对抗网络训练Pytorch代码 使用MNIST数据集生成数字图片

在pytorch框架下用LeNet5在CIFAR10数据集上实现分类+源代码+文档说明

AlexNet卷积神经网络图像分类Pytorch训练代码 使用Cifar100数据集

计算机视觉-05-目标检测：LeNet的PyTorch复现（MNIST手写数据集篇）（包含数据和代码）

Pytorch 官方 示例代码 MNIST 数据集

利用pytorch搭建lenet网络，并利用mnist数据集进行训练测试

采用pytorch实现了LeNet网络，应用CIFAR-10数据集图片分类。_pytorch-LeNet-CI

使用pytorch构建神经网络深度学习lenet-5，使用MNIST数据集，包括lenet的网络介绍ppt及程序源码

基于Pytorch框架手动构建LeNet网络实现MNIST数据集图像识别分类源码+数据集+模型.zip

基于Pytorch框架手动搭建FCN全卷积网络训练voc2012数据集python源码+详细注释.zip

使用PyTorch在CIFAR-10数据集上训练了一个VGG-16神经网络模型

pytorch-ImageNet-CIFAR-COCO-VOC-training:ImageNet（ILSVRC2012）CIFAR100COCO2017VOC2007 + VOC2012数据集的训练示例和结果图像分类对象检测包括ResNetEfficientNetVovNetDarkNetRegNetRetinaNetFCOSCenterNetYOLOvv3

LeNet代码（超详细注释）+数据集，pytorch实现

大家在看

基于双流融合网络的单兵伪装偏振成像检测.docx

ABAP代码性能指导

CMOS反相器的掩膜版图-集成电路版图设计

读写通达信股票软件二进制dat文件

FAST FACTORIZED_FFBP论文_FFBP_后向投影.zip

最新推荐

Pytorch使用MNIST数据集实现CGAN和生成指定的数字方式

pytorch学习教程之自定义数据集

PyTorch上搭建简单神经网络实现回归和分类的示例

pytorch 实现数据增强分类 albumentations的使用

pytorch 实现将自己的图片数据处理成可以训练的图片类型

PHP集成Autoprefixer让CSS自动添加供应商前缀

揭秘数字音频编码的奥秘：非均匀量化A律13折线的全面解析

arduino PAJ7620U2

网站啄木鸟：深入分析SQL注入工具的效率与限制

【GPStoolbox使用技巧大全】：20个实用技巧助你精通GPS数据处理

VGG卷积神经网络图像分类训练Pytorch代码使用Cifar100数据集

GAN网络生成人脸Pytorch代码使用CelebA数据集

WGAN生成对抗网络训练Pytorch代码使用MNIST数据集生成数字图片

AlexNet卷积神经网络图像分类Pytorch训练代码使用Cifar100数据集

Pytorch 官方示例代码 MNIST 数据集