国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“基于强化学习训练模型的方法及装置”的专利,公开号CN121981298A,申请日期为2026年1月。

专利摘要显示,本说明书实施例涉及基于强化学习训练模型的方法及装置,方法包括:将样本问题输入待训练的目标模型,得到第一目标答复;以及,将所述样本问题输入若干已训练的对照模型,得到若干对照答复;所述样本问题包括文本内容;将所述样本问题、第一目标答复,以及所述若干对照答复中任意的第一对照答复输入评价模型,得到第一目标答复相对于第一对照答复在D个预设的评价维度上的D个相对偏好评分;对第一目标答复相对于各个对照答复各自的D个相对偏好评分进行聚合操作,确定所述第一目标答复对应的第一奖励分数;至少根据第一奖励分数,更新所述目标模型的参数值。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目67次,财产线索方面有商标信息92条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员