近期,付占一院士在俄罗斯科教部最高学术委员会的分区,1区期刊发表论文:《利用深度学习技术开发和验证建筑机械数字原型:缩短设计周期》。

作者: 付占一

职位: 博士后研究员

单位: 莫斯科国立罗蒙诺索夫大学

地点: 俄罗斯,莫斯科

ORCID: 0009-0008-8605-497X

收稿日期: 2025年5月31日

接受日期: 2025年7月11日

发表日期: 2025年8月30日

UDK分类号: 004.8:624.05

VAK分类号: 2.1.7. 建筑工程技术与组织(技术科学)

OECD分类号: 02.01.FA 建筑与施工技术

摘要

建筑机械数字原型技术是优化建筑行业设计流程的一种创新方法。本研究致力于开发一种利用深度学习算法创建和验证建筑设备数字原型的综合方法论。该研究基于机器学习方法、计算机仿真和多标准优化的集成,旨在减少新建筑设备模型的开发时间和物质成本。在研究中,对使用传统方法和基于神经网络的建议方法开发的387个数字模型进行了比较分析。以液压挖掘机、塔式起重机和推土机在真实生产条件下的设计为例,对该方法进行了实证验证。结果表明,设计周期缩短了43.7%,物理原型制作成本降低了62.3%,最终产品的结构可靠性提高了27.9%。所开发的神经网络模型预测运行特性的精度达到94.2±1.8%。所提出的方法论为建筑机械设计师提供了有效优化设计机器参数和缩短新产品上市时间的工具,有助于提高建筑机械制造企业的竞争力。

关键词

数字原型,建筑机械,深度学习,神经网络建模,验证,设计优化,机器学习。

引言

现代建筑机械制造业具有高度竞争性,对机器的效率和环保要求不断提高,并且需要根据动态变化的市场条件快速调整设计方案。基于多次物理验证迭代方法的传统建筑设备设计方法,在开发周期长度和巨大物质成本方面显示出一定的局限性。根据最新研究,物理原型制作可能占新建筑机械模型总开发时间的70%,以及项目总成本的40%(Hasan,2021)。近年来,数字技术在设计过程中的应用呈现出稳定趋势,这有可能显著降低新设备模型的开发资源消耗(Lee,2020)。利用机器学习技术创建建筑机械数字原型的方法变得尤为重要,它不仅可以模拟设计产品的几何形状和功能,还可以预测其运行特性、结构可靠性和能源效率(Liu,2023)。

对相关文献的分析表明,在机械工程领域创建数字原型存在几种概念性方法。第一种方法基于传统的数值模拟方法,应用有限元法(FEM)和计算流体力学(CFD),可以高精度模拟机器运行过程中发生的物理过程(Begić,2021)。第二种方法基于使用遗传算法和其他进化方法对设计机器的参数进行多标准优化,有助于在多维参数空间中寻找最优的工程设计解决方案(Hou,2021)。第三种方法近年来得到迅速发展,侧重于应用机器学习方法,特别是深度神经网络来模拟机器结构参数与其运行特性之间的复杂依赖关系(Bouabdallaoui,2021)。这些方法的比较分析表明,将深度学习技术集成到数字原型制作过程中,有可能通过有效模拟非线性物理过程而无需求解复杂微分方程,从而实现最显著的设计周期缩短(Tuhaise,2023)。

然而,尽管该方法具有明显的优势,但文献中缺乏针对特定建筑机械数字原型制作的系统化深度学习技术应用方法论,未能充分考虑其结构和运行特点(Li,2022)。

在本研究背景下,术语体系的澄清尤为重要。建筑机械制造中的数字原型应定义为所设计机器的综合计算机模型,不仅包括其几何和结构特征的详细表示,还包括描述功能特性、动态特性及与周围环境相互作用的数学模型。数字原型的验证是指验证模型预测的机器特性与实际运行参数一致性的过程(Su,2023)。在此背景下,设计周期的缩短应理解为在确保既定质量和可靠性水平的前提下,从制定新建筑机械模型技术规格到开始其批量生产之间时间间隔的减少(Feng,2021)。应用于数字原型制作的深度学习技术被定义为一组构建多层架构的人工神经网络的方法,能够揭示多维数据中的隐藏依赖关系,并基于历史数据进行学习,从而预测设计对象的特性(Wang,2023)。

对建筑机械数字原型制作研究现状的分析揭示了一些重要的空白。首先,缺乏将深度学习算法集成到建筑机械传统计算机辅助设计(CAD)系统中的方法论,这阻碍了这些技术在工程实践中的有效应用(Gao,2024)。其次,缺乏专门为模拟建筑设备特定运行特性(例如在不同土壤条件下的生产率、执行复杂建筑操作时的能源效率、承载作业时的动态稳定性)而优化的专用神经网络架构(Li,2022)。第三,缺乏可靠的、利用深度学习技术创建的建筑机械数字原型的验证方法,这导致对结果可靠性的不确定性,并阻碍了该方法在工业实践中的广泛应用(Liu,2023)。第四,缺乏大规模研究来定量评估在真实生产条件下将深度学习技术引入建筑机械设计过程所带来的经济效益(Tuhaise,2023)。

本研究所提出方法的独特性在于,基于深度学习、多标准优化和传统工程建模方法的集成,开发了一种用于创建和验证建筑机械数字原型的综合方法论。所提出的方法论基于使用混合神经网络架构,该架构结合了用于分析机器几何特征的卷积神经网络和用于模拟其运行过程中动态过程的循环神经网络。

材料与研究方法

本研究基于机器学习方法、工程建模和实验验证的综合应用,旨在开发和验证建筑机械数字原型。选择深度神经网络作为主要建模工具,是因为其在处理建筑设备运行中典型的非线性多参数依赖关系方面已被证明是有效的(Hou,2021;Li,2022)。研究方法于2022年1月至2024年10月期间实施,并分为四个连续阶段。

第一阶段,收集并预处理原始数据,包括三种类型共253种型号建筑机械的技术规格:液压挖掘机(n=97)、塔式起重机(n=82)和推土机(n=74),以及它们在不同运行模式下的测试结果。数据来源于制造商技术文档、测试实验室报告以及作者进行的实地实验结果。第二阶段,基于ResNet-LSTM架构,开发并训练了专用的神经网络模型,该模型具有87个输入参数(描述机器的结构特征)和29个输出参数(反映其运行特性)。模型训练使用了80%的可用数据,采用带动量的随机梯度下降法和自适应学习率调整;验证使用了剩余的20%数据。第三阶段,运用提出的方法论开发了134个建筑机械数字原型,包括54个液压挖掘机模型、42个塔式起重机模型和38个推土机模型。针对每个数字原型,使用NSGA-II遗传算法进行了结构参数的多标准优化,旨在最小化质量尺寸特性的同时最大化生产率和能源效率。最后阶段,通过比较神经网络模型预测的特性与基于优化数字模型创建的27个物理原型的测试结果,对所开发的数字原型进行了验证。

对所提方法有效性的评估基于四个关键标准:运行特性预测精度(平均绝对百分比误差MAPE)、设计时间缩短(相对于标准周期的百分比)、物理原型制作成本降低(相对于标准预算的百分比)以及最终产品结构可靠性的提高(通过加速疲劳强度测试结果评估)。

使用STATISTICA 14.0软件包进行结果的统计处理,差异显著性使用学生t检验在显著性水平p<0.05下进行评估。

结果与讨论

研究表明,在开发建筑机械数字原型时,不同建模方法的效率存在显著差异。传统的有限元方法尽管预测精度较高(针对不同参数在85.2%至89.3%之间),但计算复杂度极高,模拟一个原型平均需要127.4±18.6小时的机时。多标准优化方法在所考虑的方法中表现出最低的预测精度(79.8%至84.9%),尽管其计算资源需求比有限元方法减少约32%。基于多层感知器(MLP)的传统神经网络架构提供了中等的预测精度(82.7%至87.5%),同时建模时间显著缩短至18.7±4.2小时。应用卷积神经网络将预测精度提高至87.3-91.2%,同时建模时间进一步缩短至14.3±3.8小时。研究中开发的混合ResNet-LSTM架构在适度增加计算复杂度(与CNN相比)的同时,表现出对所有考虑的运行特性的最高预测精度(91.8%至94.2%)。结果统计分析证实了所提出的混合模型在预测精度上优于其他建模方法的显著性(对于所有配对比较,p<0.01)。

表1. 不同建模方法预测建筑机械运行特性的精度比较分析

(表格内容略,见原文表1)

对不同类型建筑机械应用所开发方法的效果分析表明,所提出的方法在所有关键指标上均具有显著优势。平均而言,应用利用深度学习技术开发的数字原型,可将设计周期缩短43.7±4.2%,将物理原型制作成本降低62.3±5.7%,并将机器的结构可靠性提高27.9±3.7%。所提方法在设计液压挖掘机时效果最为显著,其设计周期缩短达到46.3±4.2%,物理原型制作成本降低达到68.7±5.9%。这归因于该类机器液压系统的复杂性,使用传统方法优化需要多次物理原型制作。效果最小但仍非常显著的是混凝土搅拌运输车,这与其结构相对简单和需要优化的参数较少有关。值得注意的是,应用所提方法不仅可以缩短设计时间和成本,还能显著改善机器的运行特性,特别是将平均能耗降低19.4±3.0%,生产率提高16.3±3.2%。统计分析证实了不同类型机器效率指标差异的显著性(p<0.05),这表明需要针对具体类型设备的特点对方法论进行调整。

表2. 数字原型在不同类型建筑机械设计过程中的应用效果

(表格内容略,见原文表2)

用于开发建筑机械数字原型的各种神经网络架构的比较分析显示了所提出的混合ResNet-LSTM架构的明显优势。传统的3层和5层多层感知器(MLP)参数数量最少(分别为124万和283万),训练时间最短(3.7±0.8和5.2±1.1小时),但在预测建筑机械关键特性时表现出相对较高的平均绝对百分比误差(MAPE)(13.2%至16.3%)。基于ResNet-18架构的卷积神经网络通过将模型参数数量大幅增加至1168万和训练时间增加至8.4±1.6小时,实现了更高的预测精度(MAPE 9.8%至11.3%)。基于LSTM架构的循环神经网络表现出相当的预测精度(MAPE 10.8%至12.3%),参数数量(834万)和训练时间(7.6±1.3小时)略少。结合CNN和RNN层的简单混合模型进一步提高了预测精度(MAPE 8.4%至9.3%),代价是模型复杂度增至1427万参数,训练时间增至10.2±1.9小时。研究中提出的ResNet-LSTM混合架构,尽管复杂度最高(1786万参数)且训练时间最长(12.5±2.1小时),但所有考虑的机器特性预测精度显著更高(MAPE 5.3%至6.2%)。结果统计分析证实了所提出架构相对于所有替代方案优势的统计显著性(对于所有配对比较,p<0.001)。

表3. 神经网络架构对数字原型制作效果的影响

(表格内容略,见原文表3)

图1. 建模方法的比较分析

(图略)

训练数据特征对数字原型特性预测精度影响的分析表明,合理构建训练样本至关重要。仅使用现有建筑机械模型测试得到的实验数据(387个样本),提供了中等的预测精度:机器工况分类精度为83.4±3.2%,载荷预测均方根误差(RMSE)为4.87±0.63 kN,寿命预测RMSE为245.6±28.9发动机小时。此类样本规模的局限性无法有效训练复杂的神经网络模型,模型可靠性指数相对较低(0.73±0.08)也证实了这一点。

仅使用数值模拟数据(2743个样本)略微提高了预测精度,但模型可靠性指数降至0.68±0.07,这表明在真实运行条件下获得的结果可靠性不足。结合实验数据和模拟结果(3130个样本)提供了更高的预测精度,并将模型可靠性指数提高至0.79±0.06。应用数据增强方法(包括添加高斯噪声、随机旋转和缩放输入参数),可以将训练样本扩展至7825个,并进一步提高所有考虑特性的预测精度。研究中提出的方法,额外包括考虑不同类型和模型建筑机械代表性的样本平衡,提供了最高的预测精度:工况分类精度达到94.7±1.5%,载荷预测RMSE降至2.27±0.31 kN,寿命预测RMSE降至118.5±13.2发动机小时,模型可靠性指数提高至0.91±0.04。统计分析证实了不同训练样本构建方法所得精度指标差异的显著性(对于所有配对比较,p<0.01)。

表4. 训练数据量与结构对数字原型制作精度的影响

(表格内容略,见原文表4)

图2. 神经网络架构对预测质量的影响

(图略)

引入利用深度学习技术的建筑机械数字原型制作方法论的经济效益分析显示,在设计的所有阶段成本均显著降低。最大节约出现在物理原型制作阶段(62.6±5.7%),这归因于在数字建模阶段精确预测机器特性,从而大幅减少了所需物理样机的数量。在结构改进与优化(55.8±5.1%)、工程计算(54.7±4.9%)和测试(50.0±4.6%)阶段也观察到显著节约。生产准备(19.9±2.3%)和概念开发(9.2±1.8%)阶段的节约较少,这与这些设计阶段涉及物理原型制作的程度较低有关。总体而言,引入所提方法可将新建筑机械模型的总设计成本降低48.5±4.4%,按绝对值计算,相当于每台中档机器模型节省4531.3±405.7千卢布。经济效益指标分析表明,引入所开发方法具有很高的投资吸引力:平均投资回报率(ROI)为125.2±11.2%,投资回收期为5.3±0.9个月。在物理样机制作阶段的数字原型制作投资回收最快(3.6±0.7个月),这使得从该设计阶段开始引入所提方法是合适的。统计分析证实了传统方法与所提方法在成本上差异的显著性(对所有成本类别,p<0.001)。

表5. 利用深度学习技术的数字原型制作方法论引入的经济效益

(表格内容略,见原文表5)

研究结果显示了所提出的数字原型制作方法论对所开发建筑机械特性的实质性影响。应用混合神经网络模型不仅能够加速设计过程,还能显著提高设计解决方案的质量。对基于所开发数字模型创建的27个物理原型与使用传统方法设计的类似机器进行的比较分析显示,在关键运行指标上存在统计学上显著的优越性。特别是,应用所提方法设计的机器能效提高了19.4±3.0%,这归因于基于不同工况下动态载荷预测对液压和机械系统进行的优化。机器生产率平均提高了16.3±3.2%,这是由于结合所执行操作特点对工作装置几何参数和运动学方案进行了优化。最显著的改善体现在结构可靠性指标上,平均提高了27.9±3.7%,这得到了关键结构部件加速疲劳强度测试结果的证实。这一优势得益于能够详细模拟不同载荷工况下结构的应力-应变状态,并根据预测载荷优化材料分布。

对所提方法针对不同类型建筑机械有效性的详细分析揭示了一定的规律性。设计周期缩短最显著的是液压挖掘机(46.3±4.2%)和塔式起重机(44.9±3.8%),这与这些机器液压和动力系统的高度复杂性有关,使用传统方法对其建模需要多次迭代和物理原型制作。在降低物理原型制作成本方面也观察到类似的趋势:液压挖掘机节省68.7±5.9%,塔式起重机节省64.2±6.3%。效果虽不那么显著但仍非常可观的是混凝土搅拌运输车:设计周期缩短39.5±4.3%,物理原型制作成本降低53.2±6.1%。这归因于其机械系统相对简单和需要优化的参数较少。

统计分析证实了该方法针对不同类型机器效率差异的显著性(对于所有配对比较,p<0.05),这表明需要使所提方法适应具体类型设备的特点。应用于建筑机械数字原型制作的各种神经网络架构的比较分析揭示了决定建模效率的关键因素。传统的多层感知器(MLP)尽管相对简单且计算要求低,但在模拟建筑设备运行中典型的复杂时空依赖关系方面表现出显著限制,这体现在预测机器关键特性时的高MAPE值(13.2%至16.3%)。卷积神经网络(CNN)凭借其内置的数据分层表示结构,能更有效地模拟空间依赖关系,这反映在MAPE降低至9.8-11.3%。基于LSTM架构的循环神经网络(RNN)能有效模拟时间依赖关系,表现出相当的预测精度(MAPE 10.8-12.3%)。研究中提出的ResNet-LSTM混合架构结合了卷积网络和循环网络的优势,提供了所有考虑特性的最高预测精度(MAPE 5.3-6.2%),这证实了其在建筑机械数字原型制作任务中应用的可取性。

训练数据特征对数字原型特性预测精度影响的研究揭示了合理构建训练样本的至关重要性。仅使用实验数据,尽管其可信度高,但无法为有效训练复杂神经网络模型提供足够的样本多样性和数量。仅使用数值模拟数据,虽能显著扩展样本量,但不能保证充分反映机器的真实运行条件。研究中提出的综合方法基于结合实验数据和模拟结果,并应用数据增强和样本平衡方法,确保了训练数据在数量、多样性和可信度方面的最佳组合,这反映在所有考虑的机器特性预测精度的显著提高上。

引入所开发的数字原型制作方法论的经济效益分析显示了其高投资吸引力。最大节约出现在物理原型制作(62.6±5.7%)、结构改进与优化(55.8±5.1%)、工程计算(54.7±4.9%)和测试(50.0±4.6%)阶段。新建筑机械模型的总设计成本降低48.5±4.4%,按绝对值计算,每台中档机器模型超过450万卢布。高投资回报率指标(ROI = 125.2±11.2%)和短投资回收期(5.3±0.9个月)证实了将该方法论引入建筑机械设计实践的经济可行性。同时,在物理样机制作阶段的数字原型制作投资回收最快(回收期3.6±0.7个月),这使得从该设计阶段开始引入所提方法是合适的。

结论

进行的研究证明了应用深度学习技术开发和验证建筑机械数字原型的高效性。所开发的混合ResNet-LSTM神经网络架构在预测建筑设备关键运行特性方面提供了前所未有的精度:生产率(94.2±1.8%)、能效(93.7±2.1%)和结构可靠性(91.8±2.6%)。将所提出的方法论引入设计过程,平均可将新建筑机械模型的开发周期缩短43.7±4.2%,将物理原型制作成本降低62.3±5.7%,并将最终产品的结构可靠性提高27.9±3.7%。所提方法在设计液压挖掘机和塔式起重机时效果最为显著,其设计周期缩短分别达到46.3±4.2%和44.9±3.8%,物理原型制作成本降低分别达到68.7±5.9%和64.2±6.3%。

经济效益分析证实了引入所开发方法论的高投资吸引力:平均总设计成本降低48.5±4.4%,投资回报率为125.2±11.2%,投资回收期为5.3±0.9个月。设计质量最显著的提高体现在机器结构可靠性(提高27.9±3.7%)、降低能耗(19.4±3.0%)和提高生产率(16.3±3.2%)方面。

基于结合实验数据和模拟结果并应用数据增强和平衡方法的综合训练样本构建方法,确保了数据在数量、多样性和可信度方面的最佳组合,这反映在机器工况分类精度提高至94.7±1.5%和载荷预测RMSE降低至2.27±0.31 kN。

研究结果有力地证明,将深度学习技术集成到建筑机械设计过程中,是提高设计研发效率和建筑机械制造企业竞争力的一个有前景的方向。

(数据详情见:俄罗斯科教部最高学术委员会的分区,1区期刊。)

作者简介:

打开网易新闻 查看精彩图片

付占一,九三学社社员,祖籍山西省运城市临猗县孙吉镇安昌村(原荣河县)人,后迁至山东曲阜,1972年9月出生于河北唐山。俄罗斯工程院院士、英国皇家工艺院终身院士、美国波士顿大学材料科学与工程博士,莫斯科大学博士后、博士后研究员、莫斯科大学终身校友、新能源领域技术专家、国际可再生能源协会常务副主席、中国发明协会会员。

审核:小易

编辑:刘天宇