strided convolution

在深度学习中，strided convolution（步幅卷积）是一种卷积操作，与传统的卷积操作相比，它的滑动步幅更大，因此在每次卷积时可以跳过更多的像素。这样可以减少计算量和降低模型的复杂度，同时也可以改变输出特征图的尺寸和分辨率。通常，步幅的大小会根据任务的需求和输入数据的尺寸进行调整。

class DownConv(nn.Module): def init(self, seq_len=200, hidden_size=64, m_segments=4,k1=10,channel_reduction=16): super().init() """ DownConv is implemented by stacked strided convolution layers and more details can be found below. When the parameters k_1 and k_2 are determined, we can soon get m in Eq.2 of the paper. However, we are more concerned with the size of the parameter m, so we searched for a combination of parameter m and parameter k_1 (parameter k_2 can be easily calculated in this process) to find the optimal segment numbers. Args: input_tensor (torch.Tensor): the input of the attention layer Returns: output_conv (torch.Tensor): the convolutional outputs in Eq.2 of the paper """ self.m =m_segments self.k1 = k1 self.channel_reduction = channel_reduction # avoid over-parameterization middle_segment_length = seq_len/k1 k2=math.ceil(middle_segment_length/m_segments) padding = math.ceil((k2*self.m-middle_segment_length)/2.0) # pad the second convolutional layer appropriately self.conv1a = nn.Conv1d(in_channels=hidden_size, out_channels=hidden_size // self.channel_reduction, kernel_size=self.k1, stride=self.k1) self.relu1a = nn.ReLU(inplace=True) self.conv2a = nn.Conv1d(in_channels=hidden_size // self.channel_reduction, out_channels=hidden_size, kernel_size=k2, stride=k2, padding = padding) def forward(self, input_tensor): input_tensor = input_tensor.permute(0, 2, 1) x1a = self.relu1a(self.conv1a(input_tensor)) x2a = self.conv2a(x1a) if x2a.size(2) != self.m: print('size_erroe, x2a.size_{} do not equals to m_segments_{}'.format(x2a.size(2),self.m)) output_conv = x2a.permute(0, 2, 1) return output_conv

这是一个用于实现降采样卷积（DownConv）的PyTorch模型类。在构造函数中，需要指定一些参数，包括序列长度seq_len，隐藏层大小hidden_size，中间段数m_segments，卷积核大小k1和通道缩减channel_reduction。其中，降采样卷积层的实现使用了两个卷积层，第一个卷积层的卷积核大小为k1，步长为k1，将输入张量进行降采样；第二个卷积层的卷积核大小为k2，步长为k2，将第一个卷积层的输出进行进一步的降采样，并按照论文中的公式计算得到输出张量。为了使得第二个卷积层的输出张量大小与中间段数m_segments相等，需要在卷积层中进行适当的padding。在前向传播时，需要将输入张量进行维度变换，使得其可以被卷积层处理，然后将卷积层的输出张量再次进行维度变换，使得其可以作为下一层的输入。如果第二个卷积层的输出张量大小不等于中间段数m_segments，则会输出一条错误信息。

阅读全文

相关推荐

Going deeper with convolutions

卷积神经网络基本计算原理.docx

Deep_Neural_Network_Python.zip_tensorflow

电气工程及其自动化 (2).docx

vs-Community2017

数据科学与大数据技术 (10).docx

高跟鞋检测24-YOLOv8数据集合集.rar

JSP基于SSM新闻发布系统网站设计毕业源码案例设计.zip

配电网自动化技术—配电网馈线监控终端.pptx

学生毕业离校系统-管理系统-毕业设计源码.zip

金融工具原型图V1.0.3.rp

道路标示线检测63-YOLO（v5至v9）、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar

金融APP（郝小懂）.rp

烟草物联网.pptx

毕业设计-汽车租赁系统.zip

我的毕业设计客户端 安卓仿饿了么、百度外卖.zip

金融产品后台（一个模块）.rp

氧化铁全球市场报告：2023年需求量增长至3641.6万吨,潜力无限

STM32H7的fatfs移植

最新推荐

电气工程及其自动化 (2).docx

vs-Community2017

数据科学与大数据技术 (10).docx

高跟鞋检测24-YOLOv8数据集合集.rar

JSP基于SSM新闻发布系统网站设计毕业源码案例设计.zip

R语言中workflows包的建模工作流程解析

管理建模和仿真的文件

【工程技术中的数值分析秘籍】：数学问题的终极解决方案

如何在数控车床仿真系统中正确进行机床回零操作？请结合手工编程和仿真软件操作进行详细说明。

Vue统计工具项目配置与开发指南

我的毕业设计客户端安卓仿饿了么、百度外卖.zip