极目新闻通讯员 王晋昊 杨柯 汪如意
“最初拿到中国航天研究院的项目需求时,我们完全摸不着头脑!”近日,2025年度中国青年科技创新“揭榜挂帅”擂台赛传来捷报,湖北工业大学本科生团队“面向综合集成研讨的战略博弈智能体构建技术”项目,在新一代信息技术领域脱颖而出,荣获全国特等奖。这支以大三学生为核心的团队,历时5个月攻坚,在不完全信息博弈建模、智能算法优化等方面实现突破,成功攻克航天领域技术难题。
五个月攻坚,从“看不懂”到“啃下来”
项目源自中国航天研究院的战略博弈技术需求,初期仅明确研发智能算法,核心规则与操作平台迟迟未公布,让以大数据管理与应用专业学生为主的团队陷入困惑。直到7月初,研究院发布基于卡牌游戏的仿真平台,包含9类国家身份、4个阶段随机事件,对战双方需在未知对方身份与决策逻辑的情况下投入资源博弈,本质是典型的不完全信息博弈问题。
“游戏化平台让宽泛的技术需求有了明确方向。”团队负责人田俊杰介绍,项目自6月启动以来,全国19支高校队伍参与角逐,11支队伍晋级决赛。初赛需击败官方基础智能体,决赛采用“两两PK”循环对战模式,每两队完成1000场对战。
备赛路上挑战重重。最初,在指导老师胡昌龙的建议下,团队计划采用大语言模型技术,却在7月中旬接到“算法需本地部署、禁止联网”的规则限制,依赖联网数据的大模型效果大幅下滑,前期研究近乎白费。面对困境,团队拆分6个研究方向分组攻关,有的小组尝试数学建模罗列所有场景,有的借鉴已发表论文的算法框架,还有的聚焦算法轻量化优化。为了筛选最优方案,团队内部PK,通过数万场模拟对战记录数据,保留效果最佳的算法并持续迭代。
平台Bug的出现更让团队遭遇重创。7月中旬,研究院修复身份颜色对应错误问题,而团队此前基于错误映射训练的模型与提示词全部失效,半个月的心血付诸东流。“我们连夜调整代码,重新建立身份与策略的对应关系,同时优化算法结构,确保在不联网环境下也能保持决策精度。”田俊杰说,为了兼顾决策速度与收益,他们舍弃了复杂的深度学习框架,采用轻量化算法设计,最终实现0.02秒快速响应,既满足比赛时间限制,又保证了对战胜率。
团队的高效协作是攻坚关键。团队建立了“一日一调度、两日一会议”的工作机制,每周指导老师还会进行一对一辅导。成员们分工明确,部分成员负责代码编写与算法调优,其他成员承担文献查阅、数据记录、平台测试等工作,甚至主动联系航天研究院技术人员沟通规则细节,确保研发不偏离方向。
技术落地可期,拓展多场景应用价值
经过数月打磨,团队研发的智能算法在决赛中表现亮眼,不仅在千场对战中保持高胜率,其快速决策能力与稳定性能也获得评委认可。该算法通过精准分析已知对战信息,动态调整资源投入策略,在不完全信息环境下实现收益最大化,其核心逻辑不仅适用于航天领域的战略博弈场景,还可拓展至应急资源调度、金融投资决策、智慧城市管理等多个领域。
“应急调度本质上也是一种不完全信息下的决策问题,比如灾害发生后,如何在信息不充分的情况下优化资源分配,我们的算法思路可以提供解决方案。”胡昌龙表示,目前已有多个相关项目表达了技术借鉴意向,团队未来计划进一步深化研究,推动技术在实际场景中落地。
“从最初的兴趣驱动,到后来的责任担当,这段经历让我们明白科技创新既要敢想敢试,更要脚踏实地。”团队成员罗友真说,作为本科生,他们在备赛过程中不仅提升了代码编写、算法设计等专业能力,更学会了在挫折中调整方向、在协作中凝聚力量。
“最珍贵的不是比赛结果,而是学生在参赛过程中的转变。”经济与管理学院党委副书记余贞说。此次获奖不仅是对团队努力的认可,更坚定了他们深耕信息技术领域、用科技解决实际问题的决心。
“学科的边界正在模糊,创新的前沿往往生于交叉地带。”胡昌龙表示,这个项目或许只是一个起点,但它清晰地揭示了一种可能:当管理思维与前沿数字技术深度融合时,传统的“软学科”便能锻造出解决时代“硬问题”的真本领。
(来源:极目新闻)
热门跟贴