矿山修复分割新突破！改进Segformer模型，无人机影像mIoU达90.85%精准识别|无人机|矿山|编码器|遥感

来源：市场资讯

（来源：计算机视觉研究院）

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12196690/pdf/sensors-25-03827.pdf

开篇痛点：矿山修复遥感分割的3大核心难题

矿山生态修复监测对精准度、自动化要求极高，无人机遥感虽能捕捉矿区精细特征，但航拍影像面临小目标识别难、多尺度特征融合不足、类别边界模糊三大痛点；传统分割模型要么全局建模能力弱，要么计算成本高，难以适配矿区复杂的地物场景（植被/农田/裸地/矿山等交织）。

针对这一行业难题，最新研究提出面向无人机矿山修复场景的改进Segformer模型，通过定制化模块增强多尺度特征表征与边缘感知能力，在自建矿区数据集和公开数据集上均实现精度碾压，为矿山生态修复自动化监测提供了全新解决方案！

核心创新：3大模块升级，让Segformer适配矿山场景

以轻量级、高效率的Segformer为基线，在编码器与解码器之间引入多尺度特征增强特征金字塔网络（MSFE-FPN），并集成两大定制化模块，从根上解决矿区分割痛点，3大核心创新直击关键：

✅ MSFE-FPN跨层融合：引入特征金字塔网络（FPN）加强编码器与解码器的跨层级特征交互，弥补原始Segformer语义-空间信息融合的不足，提升多尺度目标表征能力；

✅ SFA-PPM增强全局感知：在最深层特征层集成选择性特征聚合金字塔池化模块，通过多尺度池化+通道选择机制，强化全局语义感知与长程依赖建模，精准识别大尺度地物；

✅ ELA强化局部细节：在侧向连接中嵌入高效局部注意力模块，以轻量级注意力机制增强边缘结构与小尺度目标的敏感度，解决矿区小目标遗漏、边界模糊问题。

技术原理：极简拆解改进Segformer架构

整体沿用Segformer编码器-解码器经典架构，核心改进为编码器与解码器之间新增MSFE-FPN模块，实现「多尺度特征提取 - 分层增强融合 - 精准像素分割」，流程简单易懂：

1. 基础编码器：保留Segformer优势

采用分层Transformer结构，提取无人机影像的多尺度基础特征，兼顾全局建模能力与计算效率，无需位置编码，适配遥感影像的尺度变化；

2. 核心改进：MSFE-FPN特征增强

MSFE-FPN

SFA-PPM

ELA

3. 轻量解码器：快速语义预测

将增强特征上采样至统一分辨率，经卷积融合后生成像素级语义分割图，保持原Segformer推理速度快的优势，适配无人机影像实时处理需求。

实验验证：双数据集碾压，精度+泛化性双拉满

为验证模型性能，研究自建湖南矿山无人机数据集（HNMUD），并在公开Aeroscape无人机数据集上做泛化测试，与U-Net、DeepLabv3+、SwinTransformer等9种主流模型对比，从核心指标、视觉效果、消融实验三维验证，结果惊艳！

1. 自建HNMUD数据集：mIoU达90.85%，全指标第一

核心指标：改进 SegformermIoU=90.85%、mPA=94.77%、mF1=94.69%，相比原始Segformer mIoU提升2.60%，远超U-Net（62.43%）、DeepLabv3+（76.20%）；
视觉效果：精准区分语义相似类别（植被/农田），边界勾勒清晰，无明显误分类，小尺度建筑、矿山区域识别无遗漏；