2022华为全球校园AI算法精英赛:季军方案!

笔者鲤鱼 , 是西安交通大学人工智能学院的一名研究生 , 在2022华为全球校园AI算法精英赛的赛道二取得了季军的成绩 。
初赛阶段一直名列A榜的榜首 , 复赛前几天也一直处于A榜榜首 。虽然最后一天翻车了 , 但每次切换测试数据集都能取得稳定的优势 , 模型的泛化性能应该是比较强的 , 只是可惜最后输在了一些后处理的trick上 , 现提供一些思路 , 仅供参考 。
如需作者完整PPT , 可在后台回复关键词季军下载 。
赛题理解
本次华为全球校园AI算法精英赛的赛道二——车道渲染数据质量检测赛题 。地图数据渲染生成过程中 , 部分数据会存在诸如缺边少角 , 异形道路等缺陷 , 本赛题旨在探索可靠的高精度质检模型 。
赛事信息:华为全球校园AI算法精英赛-CV赛题 。
问题图片的范围包括:中心线问题、停止线问题、引导面问题、路肩问题、路面问题、箭头问题、车道线问题
整个问题为经典的图像分类问题 , 赛题方提供了7种异常类别的细粒度标注 , 所以整体思路可以建模为“二分类”或者“多分类(8类:正常类别+7个异常类别)”问题 。
数据分析
我们统计了有标签训练集的样本分步 , 如图1所示 , 可以看出存在以下两个特点:
长尾分布比较明显 , 各个类别样本严重不均衡 。
在异常的类别中 , 第6类“引导面”的占比最大 。(说句题外话:本赛题复赛最后的第一名就是针对第六类单独统计了一些像素值 , 最后通过这些像素值的统计特征将第6类摘出来了 , 正好第六类占比比较大 , 弯道超车 , 属实佩服)

2022华为全球校园AI算法精英赛:季军方案!

文章插图
图1:有标签训练集的样本分布
此外 , 我们还统计了有标注数据集的尺寸大小 , 发现主要是2400*1080的尺寸 , 长宽比悬殊但比较固定 , 且尺寸较大 。我们尝试过成方形的方式进行训练 , 发现效果不如等比例缩放来的好 。所以最终我们将长宽都缩小到了原来的四分之一 , 在保证训练效果的同时 , 也节省了显存开销 。
图2:有标签训练样本的图片尺寸统计数据增强
对于大部分比赛而言 , 合适的数据增强都有奇效 , 但一般很难吃准什么增强有效 , 所以大家只能盲目尝试 。但笔者一直认为高端的食材只需要简单的烹饪 , 所以我们只采用了比较基础的数据增强方式(对比度、水平翻转这些) 。这里不太适合做那种几何变换的数据增强 , 否则很容易破坏掉原图的语义结构 。
当然 , 我们观察训练集的标注 , 发现存在一张照片同属于多个异常类别这个问题 , 这表明图像可能同时存在多个异常 , 所以我们采用mixup的增强方式来提升模型分辨不同问题图片的能力 。
模型设计
对于分类问题来说 , 笔者一直觉得大道至简 , 各种花里胡哨的操作有时候还比不上简单纯粹的分类网络 , 只是需要掌握合适的烹饪手法 , 才能做出美味的佳肴 。这里给出了笔者采用的网络架构 。
图3:网络架构
当然 , 由于这个比赛比较特殊 , 存在大量的无标注数据 , 充分利用大量的无标注数据对模型性能的提升影响很大 , 所以我们的模型最终采用了三阶段的训练方式 。