对于已经画好bbox的图,如何构建target,如何用FastRCNN进行训练
时间: 2024-03-28 09:36:19 浏览: 155
python目标检测给图画框,bbox画到图上并保存案例
对于已经画好bbox的图像,我们需要将每个bbox中的物体与其对应的类别进行标注,这些标注信息可以用来构建训练目标(target)。在Fast R-CNN中,每个训练样本由一张图像和若干个RoI(即Region of Interest,感兴趣区域)组成。每个RoI是一个矩形区域,它可能包含一个物体或者不包含任何物体。
为了构建训练目标,我们需要对每个RoI进行以下处理:
1.计算RoI与所有ground truth bbox之间的IoU(Intersection over Union),找到与RoI IoU最高的ground truth bbox,并将其对应的类别作为RoI的类别。
2.对于每个RoI,我们需要为其生成一个长度为K的类别向量(K为类别总数),其中RoI对应的类别的位置为1,其余位置为0。
3.同样对于每个RoI,我们还需要生成一个长度为4K的回归向量,其中前4个数表示RoI与其对应的ground truth bbox之间的偏移量,其余位置为0。
4.最后,我们将所有RoI的类别向量和回归向量合并起来作为训练样本的target。
在训练时,我们将输入图像和对应的RoIs送入网络中,网络将会输出每个RoI的类别概率和回归偏移量,我们将其与相应的target进行比较,计算损失函数并更新网络参数。
阅读全文