金融界2025年3月28日消息,国家知识产权局信息显示,网易(杭州)网络有限公司申请一项名为“奖励模型训练方法、装置、计算机设备和存储介质”的专利,公开号CN 119691459 A,申请日期为2023年9月。

专利摘要显示,本申请实施例公开了一种奖励模型训练方法、装置、计算机设备和存储介质,通过获取样本数据集,样本数据集中每个训练样本包括行为关联数据和对应的行为风格标签;为每种行为风格获取结构相同的奖励模型;针对每种行为风格,通过行为风格的奖励模型确定训练样本与行为风格的风格匹配度;根据每种行为风格的奖励模型,针对训练样本和对应的风格匹配度生成反馈信号,反馈信号指示训练样本是否符合行为风格;针对每种行为风格的奖励模型,基于训练样本的行为风格标签和反馈信号对奖励模型进行训练,得到每种行为风格对应的训练后奖励模型,可以降低不同行为风格对应的奖励模型的获取难度。

天眼查资料显示,网易(杭州)网络有限公司,成立于2006年,位于杭州市,是一家以从事互联网和相关服务为主的企业。企业注册资本13760万美元,实缴资本13760万美元。通过天眼查大数据分析,网易(杭州)网络有限公司共对外投资了26家企业,参与招投标项目275次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可30个。

本文源自:金融界

作者:情报员