在YOLOv5中,图片进入backbone前会对图片进行切片处理。具体操作是在一张图片中每隔一个像素拿到一个值,类似于邻近下采样,这样就拿到了四张图片,四张图片互补,没有信息丢失。这样一来,将W、H信息就集中到了通道空间,输入通道扩充了4倍,即拼接起来的图片相对于原先的RGB三通道模式变成了12个通道,最后将得到的新图片再经过卷积操作,最终得到了没有信息丢失情况下的二倍下采样特征图。 将这段话换个写法但是意思不变
时间: 2023-06-24 16:06:08 浏览: 187
深度解析:YOLOv5中的CSP结构及其在Backbone中的应用
在YOLOv5中,图片在进入backbone之前会被切成四张图片。在这个过程中,每隔一个像素会取一个值,相当于进行了邻近下采样。这四张图片互补,没有任何信息丢失。通过这个方法,宽度和高度信息被转移到了通道空间,通道数增加了四倍,由原来的RGB三通道变成了12个通道。最后,对这些新的图片进行卷积操作,得到了没有信息丢失的二倍下采样特征图。
阅读全文