【2019CVPR学习】翻译( 三 )


式中ai,j,K
为第k特征通道处j顶点到i顶点的注意权重 。因此,拟议的GAC的最终产出可以表述如下:
其中*表示产生两个向量的元素生成的积,bi∈RK
是一个可学习的偏差 。
与标准卷积的关系 。网格域中标准卷积的卷积权重由邻域的局部空间位置决定 。在我们的GAC中,注意力权重不仅根据邻居的空间位置,而且根据他们的动态学习特征生成 。此外,由于GAC是在点的空间邻域上设计的,它还保留了网格域标准卷积的关键特性:权值共享和局部性 。
与先前工作的关系 。本文所提出的GAC与已有的一些工作有关,主要包括GAT[47]和[33] 。虽然我们受到了GAT的注意机制的启发[47],但我们的GAC是不同的:1)GAC不仅为不同的相邻点分配了适当的注意权重,而且还为不同的特征通道分配了适当的注意权重,因为不同通道的特征有望独立;2)与GAT相比,GAC融合了局部空间关系邻接点之间的关系,在三维形状分析中起着重要的作用;3)基于特征差异而不是两个邻接特征的连接来生成注意权重,这对于刻画特征关系更为有效和明确 。
[33]及其变体[35]通过直接学习点集,在点云分析方面取得了很有希望的结果 。的关键是使用运算符(包括MLP) 。它可以看作是GAC的一个极端情况,即“最大注意”,它通过在每个特征通道上取最大值来聚集相邻的特征 。max算子倾向于捕捉最“特殊”的特征,这会破坏对象点之间的结构连接,并对噪声敏感 。相比之下,该算法通过赋予邻域特征适当的注意权重,保持目标的结构,从而实现对邻域特征的聚集 。
理论分析 。在本节中,我们将探讨GAC的表达能力,以进一步了解GAC如何有效地学习点云的特征 。具体来说,我们考虑GAC是否能够学习精确地表示每个顶点的相邻特征 。假设输入顶点特征H是有界的,即H?[a,b]F,其中a和b分别表示下限和上限 。事实上,我们可以证明,所提出的GAC能够将图G(V,E)上任何顶点的整个邻域信息聚合到任意精度:
定理1 。设X={S:S?[a,b]F and S is },f:X→R是连续集函数w.R.t. 豪斯多夫距离dH(·,·)表示Si={hj:j∈N(i)∈X}为任意阶顶点i∈V的邻接点集 。??>0,?K∈Z和GAC的参数θ,使得对于任意i∈V,
其中γ是连续函数,gθ(Si)∈RK
是GAC的输出 。完整的证据见附录 。与类似,在最坏的情况下,我们的GAC可以学习将点云划分为一个体积表示 。在中,表示能力受输出维数K的限制,然而,由于我们的GAC中的注意力机制实际上充当了特征编码器,所以即使当k不足够大时,GAC也能够逼近集合函数f 。
3.2 图注意卷积网络
我们遵循通用的图像分割体系结构来组织我们的网络进行点云语义分割,创建了图注意卷积网络() 。不同的是,我们的是在点云的图金字塔上实现的,如图3所示 。在图金字塔的每个尺度上,应用GAC进行局部特征学习 。然后使用图池操作来降低每个特征通道中点云的分辨率 。之后,学习到的特征被逐层插值回最细的尺度 。受[27]的启发,相同规模的功能是跳过连接的 。最后,考虑到多个图形池化和特征插值层导致的特征保真度损失,在最佳尺度上增加一个GAC层用于特征细化 。
图形池化 。图池化旨在输出粗化图顶点上的聚合特征 。表示H′l为在图金字塔的第l个刻度处的输出特征集,第(l+1)个刻度的输入特征集Hl+1计算如下:
其中hv∈Hl+1和Nl(v)表示第l尺度上顶点v的邻域 。池函数可以是max或mean函数,分别对应于max和mean池〔42〕 。
特征插值 。为了最终得到与原始输入点个数相同的特征映射,必须将学习到的特征从最粗尺度逐层插值到原始尺度 。设H′lbe为图金字塔层第l阶的学习特征集,Pl and Pl-1分别为第l阶和(l-1)阶的空间坐标集 。为了得到(l-1)阶的特征,我们在plan中搜索Pl-1的三个最近邻,并计算其特征的加权和 。组合权重根据邻居的标准化空间距离计算[35] 。