国家知识产权局信息显示,浙江大学、浙江惠瀜网络科技有限公司申请一项名为“基于长思维链两阶段强化大语言模型的多块缺陷修复方法”的专利,公开号CN121209952A,申请日期为2025年9月。

专利摘要显示,本发明公开了一种基于长思维链的两阶段强化微调大语言模型的多块软件缺陷修复方法,包括:收集代码缺陷信息,将代码缺陷信息整合成特定格式;构建提示词输入长推理模型获得模型输出,筛选模型输出构造监督微调和强化学习两部分数据集;基于格式正确性和答案正确性构造奖励函数用于强化学习;使用监督微调数据集对开源小规模语言模型进行监督微调;使用强化学习数据集和奖励函数对监督微调后的模型进行强化学习,得到强化学习后的模型。本发明方法在使用较小参数量模型的同时,能够显著提升模型在自动程序修复任务上,尤其是在多块缺陷修复任务上的性能。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员