如图2-24,Mask R-CNN网络模型还将Faster R-CNN网络模型中的ROI pooling操作更换为了ROI Align操作,ROI pooling操作的作用是根据候选框的位置坐标在特征图中将相应的区域池化为固定尺寸的特征图,以便进行后续的分类和候选框回归操作。由于候选框的位置通常是由模型回归得到的,一般来讲是浮点数,而池化后的特征图要求尺寸固定,为了方便操作,会把浮点数整数化;将整数化后的候选框区域平均分成K×K个单元,对每一个单元边界再进行一次整数化,经过上述的两次整数化,此时的候选框已经和最开始回归出来的位置有一定的偏差,这个偏差还会影响识别和检测的准确度。这段话换个表达描述出来
时间: 2023-04-03 22:00:40 浏览: 120
Mask R-CNN (英文)
Mask R-CNN网络模型在ROI pooling操作的基础上,采用ROI Align操作,以解决浮点数整数化带来的精度损失问题。ROI pooling操作是将候选框的位置坐标在特征图中池化为固定尺寸的特征图,但由于候选框的位置通常是浮点数,需要整数化,这会导致候选框与最开始回归出来的位置有一定的偏差,影响识别和检测的准确度。而ROI Align操作则是在ROI pooling操作的基础上,对每个单元进行双线性插值,以保留更多的精度信息,从而提高识别和检测的准确度。
阅读全文