【2019CVPR学习】翻译( 五 )


4.2 数据集上的室外分割
数据集是目前可用的最大的激光雷达数据集,具有来自各种城市和农村场景的超过40亿个点 。每个点都有RGB值和强度值,并标记为8个类别之一:人造地形、自然地形、高植被、低植被、建筑物、硬景观、扫描工艺品和汽车 。与S3DIS数据集不同,数据集包含具有相对较大对象的室外场景 。为了适应对象的大小,数据集的采样块被设置为4m×4m,同时保持相同的最大数量的4096个点 。我们在表2中提供了对基准的-8挑战的评估结果 。
此外,我们列出了与其他最新方法相比,我们的的总体准确性和平均IoU 。
总的来说,我们的表现与许多类的其他竞争方法相当或更好 。值得注意的是,在数据集中,由于点之间的相互遮挡,大多数对象,如汽车、硬景观、建筑物和低/高植被,都是不完整的 。然而,由于GAC强大的结构化特征学习能力,我们的仍然可以学习捕获它们的区分特征进行分割 。同时,我们也注意到,在本实验中,人工地形和自然地形对于来说是相对难以分离的,因为在一个容易混淆的区域(如图4所示)中有大量的点没有出现在训练集中 。
4.3消融研究和分析
为了更好地了解在所提出的框架中所做的各种设计选择的影响,我们进一步进行了几项消融研究以证明GAC的有效性,探索GAC中空间位置和特征属性的影响,并将GAC与CRF-RNN进行了比较[53],并研究初始特征的影响 。
GAC的有效性 。为了进一步了解所提出的GAC的有效性,我们将其与[33]的max算子(包括MLP)进行了比较,后者通过直接学习点集取得了很好的效果 。具体来说,我们只将GAC中的注意机制替换为max操作符,而保持中的其余部分不变 。S3DIS数据集的测试结果见表3 。结果表明,GAC的平均IoU比max算子高出4.43%,说明GAC在区分特征学习方面比max算子具有更多的优势 。实际上,[33]中的max算子充当了一个“最大注意”机制,它倾向于刻画特征空间中点集的轮廓,同时破坏对象点之间的结构连接 。这使得max算子在对象分类方面表现良好,但在需要精细划分对象边界的地方分割能力较差 。
空间位置和特征属性 。在GAC中,相邻点的空间位置和特征属性作为空间和特征的引导,动态地产生它们的注意权重 。为了探索它们各自的角色,我们设计了另外两种仅使用空间位置和特征属性的GAC变体 。为了比较方便,他们在S3DIS数据集上的测试结果如表3所示 。实验结果表明,空间位置和特征属性在GAC中对语义点云分割具有重要作用 。空间位置跨越无序的邻域点到有意义的对象曲面,而特征属性通过给不同的邻域赋予适当的权重,进一步引导GAC适应对象的结构 。在没有空间位置约束的情况下,点只与具有相似初始特征的邻域进行信息交换,导致最终特征是零碎的,难以形成有意义的对象 。没有特征属性的引导,卷积核很难区分对象的边界,当前点很容易被相邻对象污染(如图5所示) 。
CRF-RNN 。如第3.2节所述,我们的实际上与CRF模型具有相同的特性,这鼓励相似点之间的特征和标签一致性 。为了实验验证这个声明,我们移除中的最后一个GAC层,并使用不同的迭代将其替换为CRF-RNN[53] 。具体地说,我们使用来自[21]的高斯核来计算CRF的成对势 。为了比较方便,表3还提供了它们在S3DIS数据集上的测试结果 。我们可以看到,在一次迭代中,CRF-RNN已经基本收敛,并且更多的迭代不会导致显著的精度提高 。由于我们的在网络的每一层都具有相同的CRF特征(第3.2节),CRF不再需要重现 。
初始特征的影响 。在上述S3DIS数据集上的实验中,每个点的初始特征向量由高度、RGB和地理特征组成 。在这部分我们提供了额外的消融研究,以进一步了解不同初始输入特征的的性能 。我们设计了三个对比实验,分别去除RGB信息、地理特征和两者 。S3DIS数据集的测试结果见表3 。相比之下,mIoU分别下降了2.69%、2.48%和3.89% 。然而,与测试阶段相对较大的精度差异相比,我们还注意到,没有地理特征的训练精度实际上与我们的标准相差不大(如图6所示) 。初始地理特征作为底层通用特征,根据先验知识进行设计,有利于网络的泛化 。