国家知识产权局信息显示,深圳光启尖端技术有限责任公司申请一项名为“一种擅长多目标多任务的强化学习方法”的专利,公开号CN121352063A,申请日期为2025年9月。
专利摘要显示,本申请提出一种擅长多目标多任务的强化学习方法,包括构建包含策略网络与评价网络的深度强化学习框架,其中策略网络基于输入状态生成多组参数化的概率分布,在动作采样阶段引入候选集扩展与偏移系数加权机制,在动作空间中形成多样化的候选解;在损失函数中引入余弦相似度正则项,以保持不同动作候选之间的差异性;评价网络采用双Q网络,在一条Q分支上施加随机扰动,以缓解过估计问题,提升价值评估稳健性。智能体与环境的交互经验支持多种经验并存,包括策略网络通过正态分布采样的主经验、通过柯西分布采样的从经验和随机采样的随机经验。相较于传统最大熵方法,在复杂高维任务环境下展现出更优的探索效率、策略泛化性能及任务迁移能力。
天眼查资料显示,深圳光启尖端技术有限责任公司,成立于2011年,位于深圳市,是一家以从事铁路、船舶、航空航天和其他运输设备制造业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,深圳光启尖端技术有限责任公司共对外投资了6家企业,参与招投标项目21次,专利信息385条,此外企业还拥有行政许可16个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴