reference_points = new_reference_points.detach()什么意思

这行代码的意思是将new_reference_points的计算图（graph）从整个计算图中分离出来，得到一个新的张量（tensor）reference_points，并将其赋值给变量reference_points。这个新的张量不再与原来的计算图有任何联系，因此在反向传播时不会影响原有的梯度计算。这个操作通常用于需要对部分计算图进行微调或者重复利用的情况。

class DropBlock_Ske(nn.Module): def init(self, num_point, block_size=7): super(DropBlock_Ske, self).init() self.keep_prob = 0.0 self.block_size = block_size self.num_point = num_point self.fc_1 = nn.Sequential( nn.Linear(in_features=25, out_features=25, bias=True), nn.ReLU(inplace=True), nn.Linear(in_features=25, out_features=25, bias=True), ) self.fc_2 = nn.Sequential( nn.Linear(in_features=25, out_features=25, bias=True), nn.ReLU(inplace=True), nn.Linear(in_features=25, out_features=25, bias=True), ) self.sigmoid = nn.Sigmoid() def forward(self, input, keep_prob, A): # n,c,t,v self.keep_prob = keep_prob if not self.training or self.keep_prob == 1: return input n, c, t, v = input.size() input_attention_mean = torch.mean(torch.mean(input, dim=2), dim=1).detach() # 32 25 input_attention_max = torch.max(input, dim=2)[0].detach() input_attention_max = torch.max(input_attention_max, dim=1)[0] # 32 25 avg_out = self.fc_1(input_attention_mean) max_out = self.fc_2(input_attention_max) out = avg_out + max_out input_attention_out = self.sigmoid(out).view(n, 1, 1, self.num_point) input_a = input * input_attention_out input_abs = torch.mean(torch.mean( torch.abs(input_a), dim=2), dim=1).detach() input_abs = input_abs / torch.sum(input_abs) * input_abs.numel() gamma = 0.024 M_seed = torch.bernoulli(torch.clamp( input_abs * gamma, min=0, max=1.0)).to(device=input.device, dtype=input.dtype) M = torch.matmul(M_seed, A) M[M > 0.001] = 1.0 M[M < 0.5] = 0.0 mask = (1 - M).view(n, 1, 1, self.num_point) return input * mask * mask.numel() / mask.sum()

这段代码定义了一个名为DropBlock_Ske的PyTorch模型类。该类继承自nn.Module基类，并实现了模型的前向传播逻辑。在初始化方法中，定义了一些模型的属性，包括keep_prob、block_size、num_point等。然后，定义了两个全连接网络层fc_1和fc_2，并使用nn.Sequential组织网络层的结构。最后，使用nn.Sigmoid定义了一个Sigmoid激活函数。在前向传播方法中，首先根据输入的keep_prob值判断是否需要执行DropBlock操作，如果不需要则直接返回输入。接着，获取输入张量的形状，并计算出输入张量的均值和最大值。通过两个全连接网络层对均值和最大值进行处理，将处理结果相加得到out。然后，使用Sigmoid激活函数对out进行处理，得到一个形状为(n, 1, 1, num_point)的张量input_attention_out。将input_attention_out与输入张量input相乘得到input_a。接下来，计算input_a的绝对值的平均值，并将其除以总数并乘以元素个数，得到一个形状为(n,)的张量input_abs。定义了一个gamma值，并将input_abs与gamma相乘并经过torch.clamp函数进行限制，再经过torch.bernoulli函数进行伯努利采样，得到一个形状与输入相同的二值张量M_seed。使用torch.matmul函数将M_seed与A矩阵相乘得到M。然后，将M中大于0.001的元素赋值为1.0，小于0.5的元素赋值为0.0。接着，将1减去M得到mask，将mask乘以输入张量input，并除以mask中的元素个数与总和，得到最终的输出张量。这个模型类实现了DropBlock_Ske操作，其中包含了一些全连接网络层和一些基于概率的操作。它的具体功能和用途可能需要根据上下文来确定。

pt_x_bc_var = Variable(torch.from_numpy(x_bc_var).float(), requires_grad=False) pt_x_in_pos_one = Variable(torch.from_numpy(x_in_pos_one).float(), requires_grad=False) pt_x_in_zeros = Variable(torch.from_numpy(x_in_zeros).float(), requires_grad=False) pt_t_in_var = Variable(torch.from_numpy(t_in_var).float(), requires_grad=False) pt_u_in_zeros = Variable(torch.from_numpy(u_in_zeros).float(), requires_grad=False) # 求边界条件的损失 net_bc_right = net(torch.cat([pt_x_in_zeros, pt_t_in_var], 1)) # u(0,t)的输出 mse_u_2 = mse_cost_function(net_bc_right, pt_u_in_zeros) # e = 0-u(0,t) 公式（2） net_bc_left = net(torch.cat([pt_x_in_pos_one, pt_t_in_var], 1)) # u(1,t)的输出 mse_u_3 = mse_cost_function(net_bc_left, pt_u_in_zeros) x_0 = torch.cat([pt_x_in_zeros, pt_t_in_var], 1) x_1 = torch.cat([pt_x_in_pos_one, pt_t_in_var], 1) pt_x_0 = x_0.detach().requires_grad_(True) pt_x_1 = x_1.detach().requires_grad_(True) net_bc_right.requires_grad_(True) net_bc_left.requires_grad_(True) u_x_0 = torch.autograd.grad(net_bc_right, pt_x_0, grad_outputs=torch.ones_like(net_bc_right), create_graph=True, allow_unused=True)[0][:, 0].unsqueeze(-1) u_x_1 = torch.autograd.grad(net_bc_left, pt_x_1, grad_outputs=torch.ones_like(net_bc_left), create_graph=True, allow_unused=True)[0][:, 0].unsqueeze(-1) u_xx_0 = torch.autograd.grad(u_x_0, pt_x_0, grad_outputs=torch.ones_like(u_x_0), create_graph=True, allow_unused=True)[0][:, 0].unsqueeze(-1) u_xx_1 = torch.autograd.grad(u_x_1, pt_x_1, grad_outputs=torch.ones_like(u_x_1), create_graph=True, allow_unused=True)[0][:, 0].unsqueeze(-1)这串代码有什么问题吗？该怎么解决

这段代码没有明显的语法问题，但是有可能会导致梯度计算的错误，因为在计算 u_x_0, u_x_1, u_xx_0, u_xx_1 的时候，使用了 detach() 方法，这会使得计算图中的某些节点与原来的计算图断开，从而导致梯度无法传递到这些节点，进而影响到 u 的梯度计算。为了解决这个问题，可以使用 retain_graph=True 参数来保留计算图，或者在计算 u_x_0, u_x_1, u_xx_0, u_xx_1 的时候不使用 detach() 方法。

阅读全文

reference_points = new_reference_points.detach()什么意思

相关推荐

PyTorch中切断反向传播：.detach(), .detach_()与.data详解

wpa_supplicant开发者手册：0.6.x版控制接口详解

Python库imap_detach-0.4.10版本发布

user_emb = model.user_emb.weight.detach().cpu().numpy() item_emb = model.item_emb.weight.detach().cpu().numpy()这两句代码可以换成gpu吗

D_pred = pinn.D.detach().cpu().numpy() K_pred = pinn.K.detach().cpu().numpy() 什么意思

大家在看

STM32的FOC库教程

2000-2022年 上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip

Mac OS X10.6.3 Snow Leopard系统 中文版完整安装盘 下载地址连接

SigmaStudioHelp_3.0(中文)

涉密网络建设方案模板.doc

最新推荐

java计算器源码.zip

PHP集成Autoprefixer让CSS自动添加供应商前缀

揭秘数字音频编码的奥秘：非均匀量化A律13折线的全面解析

arduino PAJ7620U2

网站啄木鸟：深入分析SQL注入工具的效率与限制

【GPStoolbox使用技巧大全】：20个实用技巧助你精通GPS数据处理

spring boot怎么配置maven

我的个人简历HTML模板解析与应用

3GPP架构深度解析：掌握网络功能与服务框架的关键

Failed to restart vntoolsd.service: Unit vntoolsd.service not found.

2000-2022年上市公司-股价崩盘风险相关数据（数据共52234个样本，包含do文件、excel数据和参考文献）.zip

Mac OS X10.6.3 Snow Leopard系统中文版完整安装盘下载地址连接