动手深度学习：Datawhale循环神经网络基础实践

23 浏览量更新于2024-08-30 收藏 48KB PDF 举报

“Datawhale深度学习实践初体验” 在本次数据科学学习小组Datawhale的活动中，我们开启了深度学习的实战篇章。动手实践是深化理解的最佳方式，通过编写代码来学习循环神经网络（RNN）的基础知识。首先，导入必要的库，包括PyTorch的核心模块torch、torch.nn用于构建神经网络层、时间管理模块time、数学函数math、系统模块sys以及自定义的d2lzh_pytorch库，该库可能包含了一些便捷的数据加载和处理函数。在设备选择上，代码优先尝试使用GPU（如果可用），否则默认使用CPU。接下来，加载预处理好的数据集，这里使用的是一个名为`d2l.load_data_jay_lyrics()`的函数，推测是加载了周杰伦歌词的词汇索引数据，包括corpus_indices（词序列的索引表示）、char_to_idx（字符到索引的映射）、idx_to_char（索引到字符的映射）以及vocab_size（词汇表大小）。为了进行RNN的训练，我们需要将输入数据转换成one-hot编码形式。为此，定义了一个`one_hot`函数，它接受一个整数数组x和类别数量n_class，返回一个one-hot编码矩阵。此外，还定义了一个`to_onehot`函数，将每个样本的列转换为one-hot编码。接着，我们初始化模型参数。这里定义了两个RNN的核心权重矩阵W_xh（输入到隐藏层）和W_hh（隐藏层到隐藏层），以及隐藏层偏置b_h，输出层权重W_hq和偏置b_q。这些参数都使用PyTorch的nn.init.normal_函数进行随机初始化，具有均值0和标准差0.01的正态分布。这部分代码展示了深度学习实践中，如何设置环境、准备数据、定义模型参数的基本流程，特别强调了循环神经网络在处理序列数据时的基础架构。后续的代码可能涉及到RNN的实现、前向传播、损失计算、反向传播和模型训练等步骤。通过这样的实践，参与者能够更好地理解和掌握深度学习模型的构建和训练过程。

Datawhale：动手深度学习第一次打卡！：动手深度学习第一次打卡！

Datawhale：动手深度学习第一次打卡！

继续一边学习一边敲代码：

循环神经网络基础循环神经网络基础

import torch

import torch.nn as nn

import time

import math

import sys

import d2lzh_pytorch as d2l

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

#%%

(corpus_indices, char_to_idx, idx_to_char, vocab_size) = d2l.load_data_jay_lyrics()

def one_hot(x, n_class, dtype=torch.float32):

result = torch.zeros(x.shape[0], n_class, dtype=dtype, device=x.device)

result.scatter_(1, x.long().view(-1, 1), 1)

return result

def to_onehot(X, n_class):

return [one_hot(X[:, i], n_class) for i in range(X.shape[1])]

#%%

# 初始化模型参数

num_inputs, num_hiddens, num_outputs = vocab_size, 256, vocab_size

def get_params():

def _one(shape):

param = torch.zeros(shape, device=device, dtype=torch.float32)

nn.init.normal_(param, 0, 0.01)

return torch.nn.Parameter(param)

W_xh = _one((num_inputs, num_hiddens))

W_hh = _one((num_hiddens, num_hiddens))

b_h = torch.nn.Parameter(torch.zeros(num_hiddens, device=device))

W_hq = _one((num_hiddens, num_outputs))

b_q = torch.nn.Parameter(torch.zeros(num_outputs, device=device))

return (W_xh, W_hh, b_h, W_hq, b_q)

def rnn(inputs, state, params):

W_xh, W_hh, b_h, W_hq, b_q = params

H, = state

outputs = [] for X in inputs:

H = torch.tanh(torch.matmul(X, W_xh) + torch.matmul(H, W_hh) + b_h)

Y = torch.matmul(H, W_hq) + b_q

outputs.append(Y)

return outputs, (H,)

def init_rnn_state(batch_size, num_hiddens, devices):

return (torch.zeros((batch_size, num_hiddens), device=device), )

X = torch.arange(10).view(2, 5)

state = init_rnn_state(X.shape[0], num_hiddens, device)

inputs = to_onehot(X.to(device), vocab_size)

params = get_params()

outputs, state_new = rnn(inputs, state, params)

def grad_clipping(params, theta, device):

norm = torch.tensor([0.0], device=device)

for param in params:

norm += (param.grad.data ** 2).sum()

norm = norm.sqrt().item()

if norm > theta:

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38716081

粉丝: 3
资源: 943

动手深度学习：Datawhale循环神经网络基础实践

d2lzh_pytorch包【下载即可用】

深度学习d2lzh_pytorch包.zip

李沐动手学深度学习(pytorch版本)”d2lzh_pytorch”包的缺少安装问题

如何查询当月的每一天的第一次打卡数据在8: 03之后，SQL server的sql语句

result = pd.DataFrame({'第一次打卡时间': first_checkin, '最后一次打卡时间': last_checkin})

解释result = pd.DataFrame({'第一次打卡时间': first_checkin, '最后一次打卡时间': last_checkin})

mysql 每天中最后一次打卡时间

读取本地xlsx文件 第一列是工号 第二列是打卡时间（2022-12-12 09:08:22），注意打卡时间可能有多次，取每个工号每天最晚打卡时间减去最早打卡时间结果与最早时间和最晚时间分别输出控制台 使用java1.8 实现

最新资源

读取本地xlsx文件第一列是工号第二列是打卡时间（2022-12-12 09:08:22），注意打卡时间可能有多次，取每个工号每天最晚打卡时间减去最早打卡时间结果与最早时间和最晚时间分别输出控制台使用java1.8 实现