深度学习作业2：卷积神经网络前向与反向传播实现

需积分: 0 151 浏览量更新于2024-08-05 收藏 357KB PDF 举报

"这是一个关于深度学习课程作业的批改标准，主要涉及卷积神经网络（CNN）的前向传播和反向传播实现。" 在给定的文件中，我们可以看到两个关键函数：`conv2d_forward` 和 `conv2d_backward`，它们分别用于CNN的前向传播和反向传播计算。这两个函数都是在Python环境中使用NumPy库编写的，NumPy是处理数组和矩阵计算的强大工具，常用于科学计算。同时，标签提到了CNN，这是一种深度学习模型，特别适合图像识别和计算机视觉任务。首先，`conv2d_forward` 函数接收以下参数： - `input`：输入数据，一个形状为(n, c_in, h_in, w_in)的4维张量，表示n个样本，每个样本有c_in个通道，高度h_in和宽度w_in。 - `W`：卷积核权重，形状为(c_out, c_in, kernel_size, kernel_size)，c_out是输出通道数。 - `b`：偏置项，形状为(c_out,)。 - `kernel_size`：卷积核大小。 - `pad`：填充大小，用于保持输入的宽度和高度不变。函数首先对输入数据进行零填充，然后使用NumPy的`convolve`函数执行二维卷积。这里卷积操作是通过将卷积核旋转90度并应用到输入数据上来完成的。对于每个输出通道，都会对所有输入通道进行此过程，并加上偏置项得到最终的输出。接下来，`conv2d_backward`函数处理反向传播，计算输入梯度、权重梯度和偏置梯度。它首先检查输出梯度的形状是否与前向传播输出一致，然后初始化各个梯度为零。函数的主要部分计算输入梯度和权重梯度，这是通过在输入数据上应用卷积核的转置完成的，类似于前向传播中的卷积过程，但使用了输出梯度来计算。这里值得注意的是，卷积神经网络的反向传播涉及到链式法则，计算每个参数对损失函数的梯度。在实践中，这些梯度通常用于更新模型的权重和偏置，以最小化损失函数，这是训练神经网络的关键步骤。这个作业批改标准覆盖了深度学习中卷积神经网络的基础概念，包括前向传播的实现、反向传播的计算以及如何使用NumPy处理数组操作。这些都是理解和实现CNN模型所必需的基本技能。

HW2-批改标准

本次作业基础分15分，扣分制。有加分项，加分最多2分。

代码

run_cnn.py （或󰙵编写的主程序）能正常运󰢩，否则扣10分。

相关代码填补正确，处错误扣1分。参考代码如下：

functions.py

import numpy as np

from scipy.signal import convolve

def conv2d_forward(input, W, b, kernel_size, pad):

n, c_in, h_in, w_in = input.shape

h_pad, w_pad = h_in + 2 * pad, w_in+2*pad

padded_input = np.zeros((n, c_in, h_pad, w_pad))

padded_input[:, :, pad:h_in + pad, pad:w_in + pad] = input

h_out, w_out = h_pad - kernel_size + 1, w_pad - kernel_size + 1

c_out = W.shape[0]

output = np.zeros((n, c_out, h_out, w_out))

for i in range(c_out):

for j in range(c_in):

ker = np.rot90(W[i, j], 2)[np.newaxis, :, :]

output[:, i] += convolve(padded_input[:, j], ker, 'valid')

output += b[np.newaxis, :, np.newaxis, np.newaxis]

return output

def conv2d_backward(input,grad_output, W, b, kernel_size, pad):

n, c_in, h_in, w_in = input.shape

_, _, h_out, w_out = grad_output.shape

assert h_out == h_in + 2 * pad - kernel_size + 1 and w_out == w_in + 2

* pad - kernel_size + 1, \

"grad_output shape not consistent with output"

h_pad, w_pad = h_in + 2 * pad, w_in + 2 * pad

c_out = W.shape[0]

# grad_input

padded_grad_input = np.zeros((n, c_in, h_pad, w_pad))

for i in range(c_in):

for j in range(c_out):

padded_grad_input[:, i] += convolve(grad_output[:, j], W[j, i]

[np.newaxis, :, :], 'full')

grad_input = padded_grad_input[:, :, pad:h_in + pad, pad:w_in + pad]

# grad_W

下载后可阅读完整内容，剩余4页未读，立即下载

不美的阿美

粉丝: 23
资源: 292

深度学习作业2：卷积神经网络前向与反向传播实现

Vivado 2016.2 Tcl命令更新与参考：新功能与替代命令

使用API进行IP地址PING测试及响应解析

Vivado 2019.2 TCL命令集：新增与核心功能概览

HW4-批改标准1119_4808062111

hw-ruby-intro.zip_SaaS软件工程_hw-ruby-intro_ruby _ruby 中文_saas

HW-02-MIAP-2020_hw1_hw2_processing_

Wenjian-Li-HW2_ComputerVision_

hw5-heat_heat_heat-equation_heatequation_

HW2-solutions_2_beacon_

EE202-HW-2_electric_

最新资源