金融界2025年6月25日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“交互方法、装置、智能体、电子设备及存储介质”的专利,公开号CN120196721A,申请日期为2025年03月。

专利摘要显示,本公开提供了一种交互方法、装置、智能体、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大模型、强化学习等技术领域。具体实现方案为:响应于接收目标问题文本,基于目标问题文本,生成提示指令;以及将提示指令输入目标大语言模型,得到符合目标任务规范的目标答案文本;其中,用于训练目标大语言模型的方法包括:响应于针对目标任务的模型训练请求,确定与目标任务关联的至少一个行业奖励模型;利用通用奖励模型和至少一个行业奖励模型分别处理答案文本,得到通用推理奖励和至少一个行业推理奖励;基于通用推理奖励和至少一个行业推理奖励,得到复合奖励;以及利用复合奖励对大语言模型进行强化学习训练,得到目标大语言模型。

天眼查资料显示,北京百度网讯科技有限公司,成立于2001年,位于北京市,是一家以从事互联网和相关服务为主的企业。企业注册资本1342128万人民币。通过天眼查大数据分析,北京百度网讯科技有限公司共对外投资了76家企业,参与招投标项目2976次,财产线索方面有商标信息1004条,专利信息5000条,此外企业还拥有行政许可56个。

本文源自金融界