摘要

近年来,机载LiDAR点云数据的应用日益广泛,其语义分割是实现三维场景理解的重要环节,但现有部分分割方法存在一定的缺陷。

本文提出了一种融合投影注意力和高程注意力机制的点云分割网络(Projection Attention and Elevation Attention Network, PE-Net)。首先,为实现高效的全局依赖建模,投影注意力模块将传统自注意力中的键和值投影至一个低秩子空间,从而以线性计算复杂度捕捉长距离关系。其次,为充分利用机载数据的垂直结构先验知识,高程注意力模块直接从点的Z坐标学习注意力权重,显式地增强了模型对地形变化的敏感度。最后,局部-全局特征增强模块通过并行的最大池化与平均池化操作聚合了多尺度上下文信息,实现了局部几何细节与全局语义的深度融合,有效提升了对复杂空间结构的表达能力。

利用ISPRS Vaihingen3D 和GML等主流机载LiDAR点云数据集对本文方法进行了验证,实验结果表明:PE-Net在ISPRS Vaihingen3D数据集上取得了82.6%的OA分数和72.1%的Avg.F1分数,在GML数据集上则达到97.0%的OA分数和72.8%的Avg.F1分数;同时,在LASDU数据集上也展现出较优的分割结果。与基线方法KPConv相比, PE-Net在GML数据集上的OA分数和Avg.F1分数上分别提升了7.0%和20.4%。

相较于现有主流方法,本文提出的PE-Net在总体精度和Avg.F1分数上均取得了显著提升,证明了PE-Net在复杂三维场景点云语义分割任务中的有效性和鲁棒性。

打开网易新闻 查看精彩图片

引用

李龙威, 刘晓栋, 陈辉, 杨礼平, 赵立科, 张卡. 基于投影注意力和高程注意力的机载LiDAR点云语义分割[J]. 地球信息科学学报, 2025, 27(11): 2684-2700

引言

打开网易新闻 查看精彩图片

本文提出了一种融合投影注意力与高程注意力机制的机载LiDAR点云语义分割网络PE-Net(Projection Attention and Elevation Attention Network)。该网络通过对传统自注意力中的键和值进行投影,得到一个投影后的注意力矩阵,以较低的计算代价建模全局长距离依赖,同时通过高程注意模块显式提升对地形变化的感知能力。此外,该网络设计了一个局部-全局特征增强模块,通过对全局和局部特征进行融合,以实现更加细致的空间结构建模。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

主要图表

打开网易新闻 查看精彩图片

图1 PE-Net网络结构示意

打开网易新闻 查看精彩图片

图2 投影注意力结构示意

打开网易新闻 查看精彩图片

图3 局部-全局特征增强模块结构示意

表1 ISPRS Vaihingen3D数据集类别分布

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图4 ISPRS Vaihingen3D数据集可视化结果

打开网易新闻 查看精彩图片

图5 ISPRS Vaihingen3D测试集分类结果混淆矩阵及误差图

打开网易新闻 查看精彩图片

图6 ISPRS Vaihingen3D测试集分类结果可视化

打开网易新闻 查看精彩图片

图7 GML测试集分类结果混淆矩阵及误差图

打开网易新闻 查看精彩图片

图8 GML测试集分类结果可视化

打开网易新闻 查看精彩图片

图9 LASDU测试集分类结果混淆矩阵及误差图

打开网易新闻 查看精彩图片

图10 LASDU测试集分类结果可视化

打开网易新闻 查看精彩图片

图11 高程注意力分数渲染图

结束语

本文针对ALS点云语义分割中全局建模不足和高程信息利用不充分的问题,提出了一种融合投影注意力与高程注意力机制的新型深度学习点云语义分割网络PE-Net。主要结论如下:

(1)为解决全局建模计算成本高昂的问题,本文设计的投影注意力模块在大幅降低计算复杂度的同时有效捕捉了长距离空间依赖。为强化对地形特征的感知,高程注意力模块显式地利用了点云的垂直结构信息。最后,通过局部-全局特征增强模块实现了多尺度特征的高效融合,显著提升了模型对复杂三维场景的综合表达能力。

(2)本文在ISPRS Vaihingen3D、GML和LASDU数据集上进行了实验验证。与KPConv基准模型相比,PE-Net在3个数据集上的Avg.F1分数分别提升了3.7%、20.4%和2.7%,验证了其在ALS点云语义分割任务中的有效性和鲁棒性。本研究为大规模点云的高效全局建模提供了新的思路,对推动高精度三维地理空间智能应用具有重要意义。

打开网易新闻 查看精彩图片

尽管PE-Net在ISPRS Vaihingen3D等3个公开点云数据集上取得了较好的语义分割结果,但其特征融合模块采用的固定池化策略在聚合全局上下文时缺乏动态适应性,从实验结果上看,在“低矮植被”这一几何形态更复杂、纹理更不规则的自然地物类别上,本方法的性能在ISPRS Vaihingen3D和LASDU数据集上相较于VD-LAB等方法存在一定差距。而这可能是因为固定的池化策略在处理这类纹理丰富但宏观结构不明显的类别时,难以自适应地捕捉到最关键的区分性特征。

未来的工作将探索引入可学习的自适应聚合策略来替代或补充固定的池化操作,以增强模型对不同类别特征的动态感知能力。另外,进一步优化模型轻量化设计,将其拓展至更多样化的点云数据,并探索与多模-态数据的融合策略,以期在更广泛的地理空间智能应用中发挥更大作用。

来源:测绘学术资讯