YOLOv4结构以及用到的tricks与创新总结( 三 ) _特征

我们将Neck部分用立体图画出来，更直观的看下两部分之间是如何通过FPN+PAN结构融合的。
（左：特征正常传递路径，中：FPN，右：引入了PAN（图中有两处用了PAN结构））
FPN层自顶向下传达强语义特征，而PAN则自底向上传达强定位特征（因为低级特征图还没有被下采样那么多，所以保留的定位信息肯定完整一点咯，而高层特征被下采样多次，更多地体现出的是较为高级抽象的语义信息咯），两两结合实属牛掰。
PAN这里还有一点需要注意：
原本的PANet网络的PAN结构中，两个特征图结合是采用操作（即add相加），而中则采用（route）操作（即堆叠），特征图融合后的尺寸发生了变化。
+（预测端部分）：
一般来说，目标检测的LOSS = 分类LOSS + BBOX回归LOSS 。
一个好的BBOX回归LOSS应该考虑三个重要几何因素：重叠面积、中心点距离，长宽比。
近年BBOX回归LOSS的发展
L1LOSS（2016）GIOU LOSS（2019）DIOU LOSS（2020）CIOU LOSS（2020）
下面分别介绍这几种IOU LOSS:
1.IOU LOSS（2016）
IOU很简单就是交并比而已。
但存在如上图这两种情况的问题：
问题1：无法优化两个框不相交的情形，当IOU为0时无法衡量两框之间的相对距离，此时LOSS不可导。
问题2：如图状态2、3他们的IOU值是相同的，但IOU无法区分两者。
2.GIOU LOSS（2019）
GIOU虽然增加了衡量相交情况的方式，但是还是存在不足。
如图这种情况，它们的GIOU都是相同的，这时不就跟IOU一个样，区分不了位置关系。
3.DIOU LOSS（2020）
针对IOU和GIOU的问题，DIOU综合考虑了重叠面积，中心点距离。当目标框包裹预测框的时候，直接度量2个框的距离，因此收敛的更快。
但问题是DIOU没有考虑到长宽比，如图：
如图它们的中心点距离相同，所以DIOU也是相同的。
4.CIOU LOSS（2020）
DIOU LOSS在CIOU LOSS的基础上增加了一项，将预测框和目标框的长宽比都考虑了进去：
再来综合的看下各个Loss函数的不同点：
：主要考虑检测框和目标框重叠面积。
：在IOU的基础上，解决边界框不重合时的问题。
：在IOU和GIOU的基础上，考虑边界框中心点距离的信息。
：在DIOU的基础上，考虑边界框宽高比的尺度信息。
中采用了的回归方式，使得预测框回归的速度和精度更高一些。
为啥用CIOU LOSS 不用CIOU NMS呢？
因为前面讲到的，是在的基础上，添加的影响因子，包含目标框 truth的信息，在训练时用于回归。但在测试阶段，我们是没有 truth的，所以不用CIOU LOSS新增加的项，即直接用DIOU LOSS 。
参考链接：深入浅出Yolo系列之&&核心基础知识完整讲解技巧学习论文翻译与解析（二）有问题欢迎评论区指出，!!!