13日,记者从南京农业大学获悉,该校主导研发出国内首个面向通用农业领域的开源垂直大语言模型“司农”。

据悉,研究团队依托南京农业大学学科优势,收集了包括动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等学科数据,涵盖了近9000册书籍、24万余篇学术论文和近2万份政策、标准,构建了体系相对完整的农业基础数据集。

针对大语言模型在专业领域应用中常见的“幻觉问题”和知识滞后性,团队在模型训练阶段,除微调传统指令外,还引入了思维链和上下文参考等多维训练数据,显著提升了模型对于农业专业知识的理解与生成能力。

针对文献知识利用效率问题,研究团队推出多智能体检索增强框架。该框架通过优化知识库构建、智能查询改写、混合检索等策略,使模型能够精准调用专业知识,保障了生成内容的准确性与时效性。(记者金凤)

(科技日报)