金融界2025年5月23日消息,国家知识产权局信息显示,合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)、新华三技术有限公司申请一项名为“多目标分布式深度学习容器调度方法、系统及存储介质”的专利,公开号CN120029720A,申请日期为2025年04月。

专利摘要显示,本发明涉及分布式深度学习技术领域,公开了一种多目标分布式深度学习容器调度方法、系统及存储介质,方法包括:利用图神经网络对节点内部GPU间的通信结构、节点内部通信性能和节点间的通信性能进行建模,生成表征节点交互特性的嵌入向量,并得到集群状态;将集群状态输入至深度Q网络,通过动作空间定义容器到节点的映射关系,基于奖励函数优化深度Q网络决策,以实现最小化通信开销并对节点负载进行均衡,实现深度Q网络的训练;将离线训练完成的深度Q网络模型部署至调度器,根据实时集群状态生成容器调度方案。本发明提出的调度方法在保证调度实时性的同时,有效缓解了分布式深度学习作业训练中的通信瓶颈。

本文源自:金融界

作者:情报员