2019 智见 AI workshop in Beijing( 二 )


Conv 。具体意思是加入蒙版(mask)训练 。有人可能会问,这不就违反“no label”的设计初衷了吗?并没有 。作者实际上加入的蒙版只是为了分开前景()和背景(),用作 DCN 的训练知道罢了 。具体加蒙版的方式采用的是传统算子做前处理加入 。
Mimic RCNNof ROI 。这个部分是作者正在进行的相关工作,意思是大概是要引入类 RCNN 的 ROI 机制去进一步提高 DCN 的效果
需要注意的是,V2 的改进较 V1 有较明显的提高,但是耗时相对 V1 多了10% 。另外,会后交流当中,作者认为对层的回归结果进行一定程度的控制会是一个好的改进方向,毕竟不同的物体虽然 scale 不一样,但是形状毕竟是连续的且只会出现在图片的某个区域,学习到远超物体范围的无论对训练还是结果都是没有意义的,而目前这些都是自行学习的 。

2019 智见 AI workshop in Beijing

文章插图
&
总结一下 DCN 实际使用上的一些改进点,
引入的限制,可以作为一种先验知识控制学习方向通过引入 DCN,在 two-stage中可以减少数量提升速度实际使用中对规整形状的物体效果有限,比如交通标志,证件,logo等(本人项目经验…) 张士峰:物体检测算法的对比探索和展望
这个 talk 主要介绍了检测算法的一系列发展和脉络,比较基础 。在传统算法阶段,经典的检测算法包括 VJ 算法和 DPM 算法等 。单独拿出这两者来讨论是因为,VJ 算法代表的思想和 DPM 算法代表的思想直到深度学习算法阶段依然起到了很大的启发作用 。的代表有 FPN,等, 的代表毫无疑问就是 RCNN 系的 two-stage 了 。
与传统算法相对的是2012年起流行至今的深度学习算法,结合目前流行的研究方法,可以将这些算法大致分成两类,即 -based 和 -free 。
-based
其中 -based 就是我们传统意义上提到 one-stage和 tow-stage了 。其中 one-stage其实可以看作是 RCNN 中的 RPN 结构(first stage) 。一步法检测器的代表作是 Yolo, SSD,。二步法检测器的代表作自然就是 RCNN- 了(RCNN -> Fast RCNN ->RCNN -> RFCN -> Mask-RCNN)
对一步法检测器(One-Stage / RPN),设计上的思路其实都是
b a c k b o n e + [ L o s s c l a s s i f y + L o s s l o c a t i o n ? r e g r e s s i o n + L o s s f e a t u r e s ]+ [ Loss_{} + Loss_{-} + Loss_{}] +[?+??+?]
二步法检测器就是在一步法检测器的结果上将精细结果的输出放到 RPN 之后而已 。
一步法对比二步法的缺点:
由于一步法在全局中进行搜索,因此出框量一般都会很大,这就导致正样本和负样本的数量极度不平衡,因此专门针对一步法出现了“困难样本挖掘”或者 Focal Loss 这样的。注意,二步法是没必要用这种东西的,因为二步法的 RPN 设计天然的减少了搜索目标的空间,私以为,RPN 后接的两个分别分类正负样本的分类器也是导致困难样本挖掘必要性降低的原因 。
基于上面提及的“正负样本极度不平衡”和“搜索空间大”两点,一步法的小目标检测容易被漏检和抑制(负样本数量过大,出现小目标的正样本置信度不高,自然就被抑制了) 。这个问题基本上就不是“困难样本挖掘”之类的方法可以解决的了 。
同样无解的是精度比二步法低,这是肯定,毕竟一步法只是二步法的一个 RPN 结构而已 。
就是为一定程度缓解这些问题而诞生的(作者广告时间~),后面再详细讲 。
-free
另一边,则是目前“死灰复燃”的 -free 方法 。在场几位 panel 部分也纷纷表示,
-free 和 -based 严格上来说还是一个方法,都不过是检测框的一个映射函数而已,实际区分不大-free 的重新兴起是基于 Focal Loss 对样本平衡的优秀性能 。