打开网易新闻 查看精彩图片

新智元报道

编辑:LRST【新智元导读】清华、哈工大等团队将几何物理知识注入大模型参数,打破AI固有的频谱偏见,精准还原微米级月壤颗粒边缘,以超越国际主流模型的卓越性能,有力支撑月球原位资源利用,服务航天强国战略需求,为国家月球科研站建设与航天器精密设计提供了不可或缺的高精度计算工具。

随着人类深空探测步伐的加快,月球地质演化研究与未来月球科研站的建设已成为航天领域的战略焦点。作为月球表面最主要的覆盖物,月壤不仅记录了月球亿万年来遭受微陨石撞击与太阳风注入的地质历史,更是未来月球原位资源利用和基础设施建设的关键物理载体。

不同于地球土壤在流水与大气侵蚀下呈现出的圆润形态,月壤颗粒长期处于真空环境中,保留了极度尖锐、复杂的几何棱角与微观纹理。精准表征这些颗粒的微观形态,对于反演月球演化历史、评估月壤力学性质以及设计适应月面环境的航天器具有不可替代的基础性价值。

然而,现有的深度学习方法在对月壤颗粒进行自动化分析时,受限于「频谱偏差」,往往倾向于优先拟合平滑的轮廓,而自动忽略复杂的边缘细节。

在月壤颗粒分割任务中,这种偏差导致算法生成的轮廓往往过于平滑,丢失了原本富含地质信息的尖锐棱角,使得计算结果难以满足高精度科研与工程应用的需求。

面对月壤物理特征与AI算法机理之间的根本性矛盾,清华大学、哈尔滨工业大学、中国科学院及中国空间技术研究院等机构的联合研究团队,提出了一种名为「Deeply Seeking Boundary」的高保真分割框架。

打开网易新闻 查看精彩图片

论文链接:https://www.chinaxiv.org/abs/202512.00315

不同于常规的模型微调策略,该研究从神经网络的学习动力学底层出发,通过显式的数学构造来重塑模型的感知逻辑。

团队首先指出了传统参数高效微调(PEFT)方法的局限性,认为现有的LoRA(低秩适应)技术通常采用随机高斯分布来初始化适应矩阵,这种任务无关的初始化策略使得模型必须完全依赖数据驱动来克服频谱偏差,训练效率低下且难以学会捕捉高频细节。

为此,研究团队提出了「高频感知初始化」(HiFi-LoRA)算法,其核心思想是将领域先验知识转化为具体的数学算子,直接注入模型的参数空间。

打开网易新闻 查看精彩图片

HiFi-LoRA示意图

具体而言,HiFi-LoRA首先利用二维离散余弦变换(DCT)在频域构建了一个理想的高通滤波器,该滤波器能够精确提取图像中的高频边缘信息。随后,通过奇异值分解(SVD)技术提取该滤波器权重矩阵中能量最集中的主成分,将其最优低秩近似作为LoRA适应矩阵的初始化参数。

这一操作的理论意义在于,它在数学上重构了神经网络的神经正切核(Neural Tangent Kernel, NTK)的初始状态。神经正切核决定了网络在训练初期的收敛行为,通过这种确定性的初始化,研究团队实际上修改了模型的特征值分布,人为放大了高频分量在梯度更新中的权重。

这意味着,模型在接触任何训练数据之前,就已经具备了对尖锐边缘的高度敏感性,从而在根本上扭转了深度学习模型「重低频、轻高频」的固有惯性。

打开网易新闻 查看精彩图片

小波能量调制(WEM)示意图

然而,仅有对高频信息的敏锐感知是不够的,过度的敏感可能导致模型将图像噪声误判为边缘细节,生成不符合物理规律的破碎轮廓。为了解决这一问题,研究团队进一步引入了物理约束机制,提出了「小波能量调制」(WEM)正则化方法。

团队经统计分析发现,分割掩膜的轮廓复杂度与其面积大小存在内在的物理关联,即过小或过大的颗粒往往轮廓相对简单,而中等尺度的颗粒则展现出最丰富的几何细节。WEM正则化直接将这一物理规律转化为训练过程中的实时几何约束。

它在模型每一次迭代时即时评估预测轮廓的边缘复杂度,并依据颗粒的物理尺度动态校准对高频细节的生成要求。这种自适应的约束机制实际上是在损失函数层面引入了一个「几何监工」,它要求模型生成的轮廓既要包含足够的高频细节,又要符合颗粒尺度所对应的物理合理性,从而实现了高保真度与几何真实性的统一。

打开网易新闻 查看精彩图片

不同分割方法的月壤分割结果对比

研究团队利用国家航天局提供的真实月壤样本,结合高分辨率显微CT成像技术,构建了全球首个包含专家级高精度边界标注的月壤颗粒分割基准数据集(LRSD)。

实验结果显示,Deeply Seeking Boundary框架在衡量边界精度的关键指标HD95上取得了突破性进展,不仅超越了2026年之前的主流分割算法,更在与被广泛认可的图像分割基础大模型SAM(Segment Anything Model)及医学影像专用大模型MedSAM的直接对比中展现出显著优势。

可视化结果表明,相比于其他模型生成的圆润轮廓,该方法生成的颗粒边界清晰锐利,精准还原了月壤颗粒的锯齿状特征。

Deeply Seeking Boundary框架的研究成果不仅为月球地质科学研究提供了一种强大的计算工具,使高通量、高精度的月壤形态分析成为可能,更在人工智能基础理论层面提出了具有启发性的新见解。

该工作证明了参数高效微调(PEFT)不应仅仅被视为一种减少计算开销的参数压缩手段,而应当被重新定义为一种结构化的「领域知识注入器」。

通过将物理世界的先验知识(如高频边缘特征)编码为数学形式(如高通滤波器),并将其显式地注入模型参数(如HiFi-LoRA),我们可以有效地引导通用大模型克服其归纳偏置,适应特定科学领域的极端需求。这种「知识驱动」与「数据驱动」相结合的范式,为解决医学影像分析、材料微观结构表征等其他细粒度分割难题提供了通用的理论框架与算法设计模式,展现了人工智能技术服务于国家重大科学工程的深远潜力与应用前景。

王一峰:第一作者,清华大学计算机系博士后,哈工大数学博士,星球采样探测团队AI技术专家,香港桂冠论坛全球200名青年科学家。发表论文50余篇,单篇最高引用超1000次,申请国家发明专利20余项,曾获清华大学水木学者、哈工大优秀毕业生、哈工大优秀博士论文,并多次荣获国家奖学金;担任国际计算机技术与信息科学会议、国际人工智能与智能体会议等分会主席,CVPR、NeurIPS、ICML、TPAMI等顶级人工智能会议和期刊的审稿人,Applied Science等期刊客座主编。他主持了广东省科技创新战略专项项目,并参与了国家「十四五」重点研发计划等项目。

汪凌昕:共同第一作者。哈尔滨工业大学机电工程学院博士研究生,主要从事空间机器人设计,星球采样探测与地外资源利用技术等方面的研究与应用。

张露:共同第一作者。哈尔滨工业大学机电工程学院博士研究生,主要从事月壤颗粒形貌评估与其工程物理特性研究。

姜生元:通讯作者。哈尔滨工业大学长聘教授。国家级高层次人才入选者,全国优秀教师,高等院校省级教学名师。哈尔滨工业大学机器人技术与系统国家重点实验室学术方向带头人,科技部重点领域创新团队负责人。中国宇航学会深空探测技术专业委员会委员、中国振动工程学会冲击与防护工程专业委员会委员、中国机械工程学会空间机构分会常委委员、国家航天局国际月球科研站大科学工程科学应用组特聘专家。曾获探月工程嫦娥五号任务先进集体、探月三期优秀个人等荣誉称号。

赵毅:通讯作者。哈尔滨工业大学教授,应用数学研究中心主任和学科学术带头人,英国数学与应用学会会士,广东省数学学会理事,广东省工业与应用数学学会常务理事,研究方向包括应用动力系统、非线性时间序列分析、复杂网络和数据科学理论等。近五年以第一/通信作者发表SCI论文59篇,其中3篇论文入选ESI高被引论文。教学成果获得2021年深圳市第四届教育教学科研优秀成果特等奖(全市唯一),2023年深圳市第五届教学成果二等奖。个人荣获深圳市十佳师德标兵和哈工大(深圳)教学名师奖。

邓宗全:中国工程院院士,哈尔滨工业大学教授,宇航空间机构及控制技术重点学科实验室主任。教育部高等学校机械基础课程教学指导委员会主任、国家高技术研究发展计划(863计划)先进制造技术领域主题专家组专家、973项目首席科学家、国家级教学名师,作为第一完成人获国家技术发明二等奖2项、国家科技进步三等奖1项,省部级奖8项,在「嫦娥二号」、「嫦娥三号」重大科技工程中做出了突出贡献,受到国家表彰。

参考资料:
https://www.chinaxiv.org/abs/202512.00315