YOLOv4结构以及用到的tricks与创新总结( 三 )


我们将Neck部分用立体图画出来,更直观的看下两部分之间是如何通过FPN+PAN结构融合的 。
(左:特征正常传递路径,中:FPN,右:引入了PAN(图中有两处用了PAN结构))
FPN层自顶向下传达强语义特征,而PAN则自底向上传达强定位特征(因为低级特征图还没有被下采样那么多,所以保留的定位信息肯定完整一点咯,而高层特征被下采样多次,更多地体现出的是较为高级抽象的语义信息咯),两两结合实属牛掰 。
PAN这里还有一点需要注意:
原本的PANet网络的PAN结构中,两个特征图结合是采用操作(即add相加),而中则采用(route)操作(即堆叠),特征图融合后的尺寸发生了变化 。
+(预测端部分):
一般来说,目标检测的LOSS = 分类LOSS + BBOX回归LOSS 。
一个好的BBOX回归LOSS应该考虑三个重要几何因素:重叠面积、中心点距离,长宽比 。
近年BBOX回归LOSS的发展
L1LOSS(2016)GIOU LOSS(2019)DIOU LOSS(2020)CIOU LOSS(2020)
下面分别介绍这几种IOU LOSS:
1.IOU LOSS(2016)
IOU很简单就是交并比而已 。
但存在如上图这两种情况的问题:
问题1:无法优化两个框不相交的情形,当IOU为0时无法衡量两框之间的相对距离,此时LOSS不可导 。
问题2:如图状态2、3他们的IOU值是相同的,但IOU无法区分两者 。
2.GIOU LOSS(2019)
GIOU虽然增加了衡量相交情况的方式,但是还是存在不足 。
如图这种情况,它们的GIOU都是相同的,这时不就跟IOU一个样,区分不了位置关系 。
3.DIOU LOSS(2020)
针对IOU和GIOU的问题,DIOU综合考虑了重叠面积,中心点距离 。当目标框包裹预测框的时候,直接度量2个框的距离,因此收敛的更快 。
但问题是DIOU没有考虑到长宽比,如图:
如图它们的中心点距离相同,所以DIOU也是相同的 。
4.CIOU LOSS(2020)
DIOU LOSS在CIOU LOSS的基础上增加了一项,将预测框和目标框的长宽比都考虑了进去:
再来综合的看下各个Loss函数的不同点:
:主要考虑检测框和目标框重叠面积 。
:在IOU的基础上,解决边界框不重合时的问题 。
:在IOU和GIOU的基础上,考虑边界框中心点距离的信息 。
:在DIOU的基础上,考虑边界框宽高比的尺度信息 。
中采用了的回归方式,使得预测框回归的速度和精度更高一些 。
为啥用CIOU LOSS 不用CIOU NMS呢?
因为前面讲到的,是在的基础上,添加的影响因子,包含目标框 truth的信息,在训练时用于回归 。但在测试阶段,我们是没有 truth的,所以不用CIOU LOSS新增加的项,即直接用DIOU LOSS 。
参考链接: 深入浅出Yolo系列之&&核心基础知识完整讲解技巧学习论文翻译与解析(二)有问题欢迎评论区指出,!!!