给我一份完整的去掉注意力机制的correction_gan的代码

时间: 2024-11-22 18:38:11 浏览: 18

gic.zip_Intensity_gamma_gamma correction_gic_intensity correctio

标题中的“gic.zip_Intensity_gamma_gamma correction_gic_intensity correction”揭示了这个压缩包内容主要涉及图像处理领域中的伽马校正（Gamma Correction）技术，用于调整图像的强度（Intensity）。这种技术通常用于改善图像的视觉效果，尤其是在显示设备上，因为不同的显示设备对亮度的响应并非线性的。Gamma值描述了这种非线性关系，调整伽马值可以改变图像的亮度和对比度。描述中的“Gamma Intensity Correction matlab code”表明这是一个用MATLAB编写的代码，用于实现伽马校正功能。MATLAB是一种广泛使用的数学计算软件，特别适合于图像处理和信号处理等领域的算法开发和实验。标签中的关键词进一步细化了主题： 1. "intensity"：指的是图像的亮度或强度，这是伽马校正所关注的核心属性。 2. "gamma_correction"：即伽马校正，是图像处理中的一种重要技术，通过改变图像的亮度曲线，以更符合人眼对亮度感知的方式显示图像。 3. "gic"：可能是指“Gamma Intensity Correction”的缩写，代表了这个代码库的核心功能。 4. "intensity_correction"：再次强调了这个代码是关于图像强度调整的。压缩包内的子文件是PGM格式的图像文件，例如： 1. "yaleB23_P00A+005E+10.pgm"、 2. "yaleB15_P00A+060E-20.pgm"、 3. "yaleB23_P00A+000E+90.pgm"、 4. "yaleB15_P00A+010E-20.pgm" 这些文件是Yale Face Database B的一部分，这是一个常用的人脸图像数据库，通常用于面部识别和表情分析的研究。每个文件名中的“P00A”、“005E”等部分可能是表示光照条件的参数，这表明这些图像在不同光照条件下拍摄，可能被用来测试伽马校正在不同光照环境下的效果。综合以上信息，我们可以推断这个MATLAB代码库是用于对Yale Face Database B中的图像进行伽马校正处理，以优化显示效果并可能提高后续处理（如人脸识别）的性能。伽马校正不仅影响图像的视觉感知，还能影响计算机对图像特征的分析，因此在图像处理领域具有重要应用价值。

以下是去掉了注意力机制的 `correction_gan` 代码： ```python import torch import torch.nn as nn import torch.optim as optim import torch.nn.functional as F from torch.utils.data import Dataset, DataLoader from torchvision import transforms from PIL import Image import os import argparse import glob import matplotlib.pyplot as plt from tqdm import tqdm import numpy as np class UNet(nn.Module): def __init__(self): super(UNet, self).__init__() self.encoder = nn.Sequential( nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1), nn.ReLU(), nn.MaxPool2d(kernel_size=2, stride=2), nn.Conv2d(64, 128, kernel_size=3, padding=1), nn.ReLU(), nn.MaxPool2d(2), ) self.decoder = nn.Sequential( nn.ConvTranspose2d(128, 64, kernel_size=2, stride=2), nn.ReLU(), nn.ConvTranspose2d(64, 3, kernel_size=2, stride=2), nn.Sigmoid(), ) def forward(self, x): x = self.encoder(x) x = self.decoder(x) return x class Generator(nn.Module): def __init__(self): super(Generator, self).__init__() self.encoder1 = self.conv_block(3, 64) self.encoder2 = self.conv_block(64, 128) self.encoder3 = self.conv_block(128, 256) self.encoder4 = self.conv_block(256, 512) self.bottleneck = self.conv_block(512, 1024) self.upconv4 = nn.ConvTranspose2d(1024, 512, kernel_size=2, stride=2) self.decoder4 = self.conv_block(1024, 512) self.upconv3 = nn.ConvTranspose2d(512, 256, kernel_size=2, stride=2) self.decoder3 = self.conv_block(512, 256) self.upconv2 = nn.ConvTranspose2d(256, 128, kernel_size=2, stride=2) self.decoder2 = self.conv_block(256, 128) self.upconv1 = nn.ConvTranspose2d(128, 64, kernel_size=2, stride=2) self.decoder1 = self.conv_block(128, 64) self.final_conv = nn.Conv2d(64, 3, kernel_size=1, stride=1, padding=0) self.sigmoid = nn.Sigmoid() def conv_block(self, in_channels, out_channels): return nn.Sequential( nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=1, padding=1), nn.BatchNorm2d(out_channels), nn.ReLU(inplace=True), nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1), nn.BatchNorm2d(out_channels), nn.ReLU(inplace=True) ) def forward(self, x): e1 = self.encoder1(x) e2 = self.encoder2(F.max_pool2d(e1, 2)) e3 = self.encoder3(F.max_pool2d(e2, 2)) e4 = self.encoder4(F.max_pool2d(e3, 2)) b = self.bottleneck(F.max_pool2d(e4, 2)) d4 = self.upconv4(b) d4 = torch.cat((e4, d4), dim=1) d4 = self.decoder4(d4) d3 = self.upconv3(d4) d3 = torch.cat((e3, d3), dim=1) d3 = self.decoder3(d3) d2 = self.upconv2(d3) d2 = torch.cat((e2, d2), dim=1) d2 = self.decoder2(d2) d1 = self.upconv1(d2) d1 = torch.cat((e1, d1), dim=1) d1 = self.decoder1(d1) out = self.final_conv(d1) out = self.sigmoid(out) return out class Discriminator(nn.Module): def __init__(self): super(Discriminator, self).__init__() self.main = nn.Sequential( nn.Conv2d(3, 64, kernel_size=4, stride=2, padding=1), nn.LeakyReLU(0.2, inplace=True), nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=1), nn.BatchNorm2d(128), nn.LeakyReLU(0.2, inplace=True), nn.Conv2d(128, 256, kernel_size=4, stride=2, padding=1), nn.BatchNorm2d(256), nn.LeakyReLU(0.2, inplace=True), nn.Conv2d(256, 512, kernel_size=4, stride=2, padding=1), nn.BatchNorm2d(512), nn.LeakyReLU(0.2, inplace=True), nn.Conv2d(512, 1, kernel_size=16), ) def forward(self, x): return self.main(x).view(-1) def compute_iou(outputs, targets, threshold=0.5): outputs = (outputs > threshold).float() targets = (targets > threshold).float() intersection = (outputs * targets).sum(dim=(1, 2, 3)) union = outputs.sum(dim=(1, 2, 3)) + targets.sum(dim=(1, 2, 3)) - intersection iou = (intersection + 1e-6) / (union + 1e-6) return iou.mean().item() from skimage.metrics import peak_signal_noise_ratio as psnr_metric from skimage.metrics import structural_similarity as ssim_metric def compute_psnr(outputs, targets): outputs = outputs.cpu().detach().numpy() targets = targets.cpu().detach().numpy() psnr = 0 for i in range(outputs.shape[0]): psnr += psnr_metric(targets[i], outputs[i], data_range=1.0) return psnr / outputs.shape[0] def compute_ssim(outputs, targets): outputs = outputs.cpu().detach().numpy() targets = targets.cpu().detach().numpy() ssim = 0 for i in range(outputs.shape[0]): output_img = outputs[i].transpose(1, 2, 0) target_img = targets[i].transpose(1, 2, 0) H, W, _ = output_img.shape min_dim = min(H, W) win_size = min(7, min_dim if min_dim % 2 == 1 else min_dim - 1) win_size = max(win_size, 3) ssim += ssim_metric(target_img, output_img, data_range=1.0, channel_axis=-1, win_size=win_size) return ssim / outputs.shape[0] def wasserstein_loss(pred, target): return torch.mean(pred * target) from torch.autograd import grad def compute_gradient_penalty(discriminator, real_samples, fake_samples, device): alpha = torch.rand(real_samples.size(0), 1, 1, 1, device=device) interpolates = (alpha * real_samples + ((1 - alpha) * fake_samples)).requires_grad_(True) d_interpolates = discriminator(interpolates) fake = torch.ones(real_samples.size(0), device=device) gradients = grad(outputs=d_interpolates, inputs=interpolates, grad_outputs=fake, create_graph=True, retain_graph=True, only_inputs=True)[0] gradients = gradients.view(gradients.size(0), -1) gradient_penalty = ((gradients.norm(2, dim=1) - 1) ** 2).mean() return gradient_penalty def train_correction_model(generator, discriminator, dataloader, optimizer_G, optimizer_D, device, lambda_gp, lambda_pixel, n_critic): generator.train() discriminator.train() running_g_loss = 0.0 running_d_loss = 0.0 running_iou = 0.0 running_psnr = 0.0 running_ssim = 0.0 for batch_idx, (inputs, targets) in enumerate(tqdm(dataloader, desc="Training")): inputs = inputs.to(device) targets = targets.to(device) # Train Discriminator optimizer_D.zero_grad() corrected_images = generator(inputs) real_validity = discriminator(targets) fake_validity = discriminator(corrected_images.detach()) gp = compute_gradient_penalty(discriminator, targets.data, corrected_images.data, device) d_loss = -torch.mean(real_validity) + torch.mean(fake_validity) + lambda_gp * gp d_loss.backward() optimizer_D.step() # Train Generator if batch_idx % n_critic == 0: optimizer_G.zero_grad() corrected_images = generator(inputs) fake_validity = discriminator(corrected_images) g_adv_loss = -torch.mean(fake_validity) pixelwise_loss = nn.L1Loss() g_pixel_loss = pixelwise_loss(corrected_images, targets) g_loss = g_adv_loss + lambda_pixel * g_pixel_loss g_loss.backward() optimizer_G.step() else: g_loss = torch.tensor(0.0) running_g_loss += g_loss.item() running_d_loss += d_loss.item() iou = compute_iou(corrected_images, targets) psnr = compute_psnr(corrected_images, targets) ssim = compute_ssim(corrected_images, targets) running_iou += iou running_psnr += psnr running_ssim += ssim epoch_g_loss = running_g_loss / len(dataloader) epoch_d_loss = running_d_loss / len(dataloader) epoch_iou = running_iou / len(dataloader) epoch_psnr = running_psnr / len(dataloader) epoch_ssim = running_ssim / len(dataloader) return epoch_g_loss, epoch_d_loss, epoch_iou, epoch_psnr, epoch_ssim def validate_correction_model(generator, discriminator, dataloader, device, lambda_gp): generator.eval() discriminator.eval() running_g_loss = 0.0 running_d_loss = 0.0 running_iou = 0.0 running_psnr = 0.0 running_ssim = 0.0 with torch.no_grad(): for inputs, targets in tqdm(dataloader, desc="Validation"): inputs = inputs.to(device) targets = targets.to(device) corrected_images = generator(inputs) real_validity = discriminator(targets) fake_validity = discriminator(corrected_images) d_loss = -torch.mean(real_validity) + torch.mean(fake_validity) g_adv_loss = -torch.mean(fake_validity) g_loss = g_adv_loss running_g_loss += g_loss.item() running_d_loss += d_loss.item() iou = compute_iou(corrected_images, targets) psnr = compute_psnr(corrected_images, targets) ssim = compute_ssim(corrected_images, targets) running_iou += iou running_psnr += psnr running_ssim += ssim epoch_g_loss = running_g_loss / len(dataloader) epoch_d_loss = running_d_loss / len(dataloader) epoch_iou = running_iou / len(dataloader) epoch_psnr = running_psnr / len(dataloader) epoch_ssim = running_ssim / len(dataloader) return epoch_g_loss, epoch_d_loss, epoch_iou, epoch_psnr, epoch_ssim def visualize_results(generator, dataloader, device, num_images=10, save_path='./results'): generator.eval() inputs, targets = next(iter(dataloader)) inputs = inputs.to(device) targets = targets.to(device) with torch.no_grad(): corrected_images = generator(inputs) inputs = inputs.cpu().numpy() targets = targets.cpu().numpy() corrected_images = corrected_images.cpu().numpy() if not os.path.exists(save_path): os.makedirs(save_path) plt.figure(figsize=(20, 10)) for i in range(num_images): plt.subplot(3, num_images, i + 1) plt.imshow(targets[i].transpose(1, 2, 0)) plt.title("Original") plt.axis('off') plt.subplot(3, num_images, i + 1 + num_images) plt.imshow(inputs[i].transpose(1, 2, 0)) plt.title("Simulated Colorblind") plt.axis('off') plt.subplot(3, num_images, i + 1 + 2 * num_images) plt.imshow(corrected_images[i].transpose(1, 2, 0)) plt.title("Corrected") plt.axis('off') plt.tight_layout() plt.savefig(f'{save_path}_visualization.png') plt.show() def plot_and_save_metrics(train_metrics, val_metrics, epoch, path='./metrics_plots'): if not os.path.exists(path): os.makedirs(path) epochs = np.arange(1, epoch + 1) train_g_losses, train_d_losses, train_ious, train_psnrs, train_ssims = zip(*train_metrics) val_g_losses, val_d_losses, val_ious, val_psnrs, val_ssims = zip(*val_metrics) plt.figure() plt.plot(epochs, train_g_losses, label='Training Generator Loss') plt.plot(epochs, val_g_losses, label='Validation Generator Loss') plt.xlabel('Epoch') plt.ylabel('Loss') plt.title('Generator Loss over Epochs') plt.legend() plt.savefig(f'{path}/generator_loss.png') plt.close() plt.figure() plt.plot(epochs, train_d_losses, label='Training Discriminator Loss') plt.plot(epochs, val_d_losses, label='Validation Discriminator Loss') plt.xlabel('Epoch') plt.ylabel('Loss') plt.title('Discriminator Loss over Epochs') plt.legend() plt.savefig(f'{path}/discriminator_loss.png') plt.close() plt.figure() plt.plot(epochs, train_ious, label='Training IoU') plt.plot(epochs, val_ious, label='Validation IoU') plt.xlabel('Epoch') plt.ylabel('IoU') plt.title('IoU over Epochs') plt.legend() plt.savefig(f'{path}/iou.png') plt.close() plt.figure() plt.plot(epochs, train_psnrs, label='Training PSNR') plt.plot(epochs, val_psnrs, label='Validation PSNR') plt.xlabel('Epoch') plt.ylabel('PSNR') plt.title('PSNR over Epochs') plt.legend() plt.savefig(f'{path}/psnr.png') plt.

阅读全文

给我一份完整的去掉注意力机制的correction_gan的代码

相关推荐

Phase_Correction.zip_michelson _phase correction_phase error_pha

DMW.rar_baseline correction_动态翘曲_翘曲_色谱

Correction_oracle_zip_

Correction_advisor

Correction-NTRE.zip_Correction_TP

pycorrector_is_a_toolkit_for_text_error_correction_

rfc5053.Raptor_Forward_Error_Correction_Scheme_for_Object_Delivery

tp4_docker_compose_correction_202001

c_correction_run.zip_envi_run

giunei_v69.zip_channel correction_pmusic_信道校正_校正

gamma.rar_HSI enhancement_color correction_contrast enhancement_

yuyan.rar_Fisheye Correction_fisheye_yuyan.rar_鱼眼_鱼眼 校正

formatted_task1164_coda19_section_correction_classification.json

correction_curvature.zip_waveguide_模式 波导_波导 模式

AGC_weighted.zip_AGC matlab_Digital State_gamma correction_proba

histe.rar_gamma_gamma correction_gamma校正_gamma灰度变换_灰度校正

gray-level_correction_noel202007.zip

PFC.zip_Boost_PFC correction_PFC power_PFC校正电路_不控整流

RANSAC.zip_Ransac椭圆拟合_ellipse correction_matlab 磁力计_ransac 拟合椭圆_

最新推荐

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

"互动学习：行动中的多样性与论文攻读经历"

【Shell脚本进阶】：wc命令行数统计的高级用法及解决方案

python编写一个程序，使得根据输入的起点和终点坐标值计算出坐标方位角

Achilles-2 原始压缩包内容解密

yuyan.rar_Fisheye Correction_fisheye_yuyan.rar_鱼眼_鱼眼校正

correction_curvature.zip_waveguide_模式波导_波导模式