国家知识产权局信息显示,北京小米移动软件有限公司和北京小米松果电子有限公司申请一项名为“一种策略模型训练方法、装置、设备和程序产品”的专利,公开号CN121615766A,申请日期为2025年11月。
专利摘要显示,本公开是关于一种策略模型训练方法、装置、设备和程序产品。该方法可以包括:根据输入的任务指令,获取策略模型在执行该任务指令所指示的目标任务时的当前推理轨迹;基于当前推理轨迹中的当前工具调用次数,确定当前推理轨迹的工具使用奖励值;根据工具使用奖励值,确定当前推理轨迹的总奖励值;其中,工具使用奖励值与工具调用差异呈负相关,工具调用差异与策略模型针对目标任务的历史推理轨迹中的工具调用次数相关;根据总奖励值,对该模型进行更新。通过本公开的技术方案,可以引导策略模型抑制非必要的工具调用行为,提升了策略模型的推理效率与资源利用率,实现了策略模型的推理效率与执行结果准确率的平衡。
天眼查资料显示,北京小米移动软件有限公司,成立于2012年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本148800万人民币。通过天眼查大数据分析,北京小米移动软件有限公司共对外投资了4家企业,参与招投标项目146次,专利信息5000条,此外企业还拥有行政许可123个。
北京小米松果电子有限公司,成立于2014年,位于北京市,是一家以从事零售业为主的企业。企业注册资本25000万人民币。通过天眼查大数据分析,北京小米松果电子有限公司共对外投资了1家企业,财产线索方面有商标信息15条,专利信息1211条,此外企业还拥有行政许可5个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴