![](https://csdnimg.cn/release/download_crawler_static/87719800/bg3.jpg)
个网格后面跟着 30 个变量值,其中前 10 个就为该网格预测出的两个框的变量值。
我们在前面分析到,每一个预测框有一个 confidence 属性表征其包含物体的概率。但具其
体包含的是哪个物体,就需要计算出这个框包含每一类物体的概率。在 YOLOv1 中有 20 个
类别的物体,所以输出结果的后 20 个值就表示每一个小网格(grid cell)对应每一类物体的
概率,即由该网格生产的两个预测框对应每一类物体的概率。 由此,输出的 7 × 7 × 30
7\times7\times307×7×30 向量的每一项含义便清楚了。
但经过上面分析,一张图片一共生产 7 × 7 × 2 7\times7\times27×7×2 个框,但只有一部分
框我们认为是真正找到物体的,所以我们还需要使用一些后处理方法,去掉无用的框。根据
上面的分析,我们输出结果中有每个框包含物体的概率(confidence)以及每个框在包含物
体的情况下是每个类别的概率。将二者相乘就是每个框是每个类别物体的概率。我们通过这
个概率即可去掉无用的框,选出真正预测到物体的框。
见下图我们将所有框预测到的概率值按照每一行是一个概率列出来,并逐行处理。例如我们