陕西农信：基于AI大模型的智能化应用|大模型|智能化应用|知识库|通用|陕西农信

来源：2025年度农村金融机构科技创新优秀案例评选

获奖单位：陕西农信

荣获奖项：数智应用创新优秀案例

一、项目背景

随着人工智能技术的迅猛发展，以大模型为代表的生成式AI正加速重构金融行业的服务模式与竞争格局，其应用价值日益凸显。国家“十四五”规划和《金融科技发展规划（2022-2025年）》鼓励金融机构加快数字化转型，推动AI技术落地。人民银行2025年科技工作会议进一步强调，要加快金融数字化智能化转型，安全稳妥有序推进人工智能大模型等在金融领域应用。

银行业作为数据密集型行业，沉淀了海量非结构化数据，然而传统机器学习模型语义理解能力薄弱，难以高效处理和深度挖掘此类非结构化信息，导致大量高价值数据未能转化成实际生产力。面对利差持续收窄、市场竞争加剧等多重挑战，银行业亟需借助大模型技术实现数字化转型升级。通过大模型强大的语义理解与推理能力，不仅能替代重复性人工操作，提高员工工作效率；更可深入应用于信贷营销、风险防控、运营管理等核心业务环节，推动流程重构与模式创新。

在此背景下，陕西农信积极探索大模型技术的工程化、规模化落地路径。针对中小金融机构普遍面临的模型适配成本高、领域知识融合难等问题，以“自主可控、分层解耦、模块化设计”的建设思路，构建涵盖算力、模型、工具、应用四个层级的大模型平台，整合高性能算力资源与先进AI技术，并基于DeepSeek、Qwen等主流开源大模型，通过检索增强生成、知识图谱、意图分析、实体识别等多技术综合应用在不同业务领域构建智能化应用，实现从通用大模型向专业化、场景化智能服务的转化。将大模型能力与具体业务场景深度融合，应用于日常办公、信贷、审计、客服、反洗钱等多个业务场景，显著提升陕西农信经营管理质效及风险防控能力。

二、创新点

1、引入知识图谱技术，提升大模型对私域数据的理解能力

在智能问数场景中，若仅依赖大语言模型（LLM）直接生成SQL，则因缺乏对私域数据资产（如表结构、字段口径、业务规则、指标维度等）的精准掌握，极易产生幻觉，生成字段误用、表关联错误或口径偏差的SQL语句，给出错误答案。为解决上述问题，我们在智能问数应用中引入知识图谱增强的检索增强生成（GraphRAG）技术，在传统RAG框架基础上引入知识图谱，将全行数据资产(包括数据库表、业务术语、指标定义、维度层级及表间关联关系等)构建成“实体-关系-实体”三元组形式的知识图谱，当用户输入问题后，首先识别问题中涉及的核心实体，基于实体在知识图谱中的位置，执行扩展检索，而非仅依赖文本相似度进行检索，该检索结果作为结构化上下文注入大语言模型，显著增强大模型对私域数据语义的理解能力，大幅提升了自然语言到SQL转换的准确性与可靠性。

2、多技术深度融合，实现智能数据分析

区别于传统仅聚焦SQL生成的数据问答系统，我们创新性地构建了一个多技术深度融合、业务导向的智能数据分析体系。以GraphRAG提供的精准语义理解为基础，进一步打通“自然语言理解→业务意图对齐 →安全SQL生成→数据洞察分析”的完整链路。一是引入意图识别与上下文理解模块，精准捕捉用户提问的真实业务意图，对模糊、口语化或不完整表达进行智能补全与语义对齐。二是引入校验机制，在SQL生成后结合数据权限、操作类型等进行校验，确保语句安全合规。三是在获取查询结果后，基于预设的趋势判断、异常检测、对比解读等模板，对原始数据进行初步解读，生成简洁可读的分析内容，并支持可视化图表的生成。建议多技术综合运用，将提问意图分析、数据资产、业务逻辑、权限管控与数据解读能力深度融合，不仅解决了业务人员无法进行复杂数据查询的痛点，还可进一步提炼数据价值，辅助业务决策。

3、大小模型协同，满足不同场景的差异化需求

大模型具备强大的语言理解与生成能力，擅长通用知识推理，但其存在推理幻觉、算力资源要求高等问题，难以满足所有场景需求。而小模型在结构化数据处理上具有更高的精准性与可靠性，通过大小模型的协同，使大模型专注于复杂问题处理，小模型负责高频、标准化任务，在降低整体算力消耗的同时提升了大模型输出的稳定性与准确性。在反洗钱可疑交易报告智能生成应用中，我们基于历史交易数据、客户身份信息、行为日志等多维数据构建机器学习模型，在海量数据中快速识别异常交易行为客户，输出可疑概率和风险等级。在此基础上，大模型综合机器学习模型结果与非结构化信息，对高风险案例进行深度研判，自动生成可疑交易分析报告初稿供人工审核。通过大小模型的协作模式，可显著降低误报率和人工复核负担。

4、基于开源模型自主研发，低成本构建各类场景应用

陕西农信大模型智能化应用以开源模型（如DeepSeek、Qwen等）为基础，从数据处理流程到应用层接口开发，整个技术栈的关键环节均由团队自主研发完成。整体开发流程陕西农信自身开发体系深度融合，能快速、低成本的构建各类应用场景，不仅可以根据特定业务场景和用户需求进行精准的模型调优和应用设计，还能够规避供应商后续的维护、升级风险，大幅降低研发成本。

三、项目方案

3.1 项目目标

当前，以大模型为代表的生成式人工智能技术正在重塑金融业的生态格局，陕西农信作为服务“三农”、支持地方经济发展的关键金融力量，全面推进数字化转型战略，积极探索“低成本、高效率、可持续”的大模型落地实施路径。通过“开源+自研”模式，构建以Deepseek、Qwen等开源大模型为核心的技术底座，打造涵盖模型运行管理、应用场景开发为一体的陕西农信大模型应用开发框架。主要包含以下目标：

一是搭建异构算力资源底座，实现算力管理的智能化。根据智能合规、数字人及其他大模型应用场景的使用需要，搭建满足信创要求，涵盖多家算力服务器厂商的算力资源池。

二是构建大模型应用开发框架，提高应用开发效率。按照陕西农信数字化转型总体规划，构建以Deepseek、Qwen等开源大模型、Dify/Ragflow等开源应用开发组件为核心的技术底座，打造涵盖模型运行管理、应用场景开发为一体的陕西农信大模型应用开发框架。通过开源技术的先行先试，为后续升级完善大模型平台整体架构奠定基础。

三是多场景应用建设，提升业务办理能力。重点围绕知识问答、内容生成、数据查询等常用场景较为明确、实际需求较为迫切、能够体现大模型优势的领域，完成信贷操作问答、智能客服坐席问答、审计报告撰写、审计整改分析、智能数据分析、代码辅助生成、智能简历评价等场景投产，通过将大模型服务嵌入各系统业务流程或具体使用场景，让大模型为陕西农信各类金融服务提供智能化技术支撑。

3.2 技术架构

大模型平台架构由四部分组成，依次为算力层、模型层、工具层、应用层，如图1所示。

算力层

算力层围绕模型层、工具层需求构建，为模型层、工具提供计算能力支撑，包括CPU资源、GPU资源、交换机、高性能网络和存储。当发起大模型推理或训练请求时，算力层通过合理调度算力资源高效执行运算任务，确保大模型能够快速、准确地输出结果，满足对大模型应用服务的高效性和稳定性要求。

模型层

模型层是大模型平台的“心脏”，包括模型运行引擎、模型仓库、模型管理三个模块，承担着核心的大模型推理运算与大模型优化功能，是保障平台高效、稳定、灵活运行的关键支撑。

工具层

工具层提供知识库、工作流等各类开发工具，可根据业务需求开发各类智能化服务。包括数据管理、向量知识库、智能体开发、封装发布四个模块。目前使用开源Dify和Ragflow工具实现工具层功能，后续根据大模型服务的使用情况，逐步替换为商用软件，以满足性能和高可用等方面要求。

应用层

应用层聚焦于提供多样化、高价值的智能助手服务，可深度集成至各类业务系统，全面满足不同场景下的业务需求。该层核心涵盖三大类智能应用。一是知识问答雷应用，主要基于业务知识库和检索增强技术，精准解析用户提问，不仅能快速响应常规知识咨询，还可针对复杂问题进行深度推理。二是内容生成类应用，通过借助大模型的自然语言处理和生成技术，实现多样化的内容创作与深度分析，包括代码生成、报告生成、分析决策等创作任务。三是数据分析类应用，支持从数据库中快速查询数据并进行分析洞察，用户仅需通过自然语言下达指令，即可完成复杂的数据查询操作，并对数据进行分析。

3.3落地应用

基于DeepSeek、Qwen等主流开源大模型，通过检索增强生成、知识图谱、意图分析、实体识别等多技术综合应用在不同业务领域构建智能化应用，实现从通用大模型向专业化、场景化智能服务的转化。

1、多技术协同实现智能问数

为解决业务人员用数问题，我社以Qwen3开源大模型为核心，结合意图识别、检索增强、知识图谱等技术构建了融合大模型与多技术协同的智能问数应用，解决非技术人员通过自然语言自助完成复杂数据查询与分析的问题。

在进行数据查询时，系统通过意图识别模型，精准解析用户查询提问（如指标、维度、时间范围、过滤条件等），并自动补全模糊或缺失的语义要素。随后，利用RAG技术动态检索相关表结构、字段口径及表间关联关系，作为上下文注入大模型，显著提升SQL生成的准确性与合规性。在此基础上，Qwen3大模型基于增强后的上下文，自动生成标准SQL语句，生成的SQL经过数据权限及安全校验后，后端对接全行报表、指标、标签等数据资产，使复杂数据需求的一次性命中率显著提升。为进一步提升分析体验，系统集成智能洞察与轻量级BI可视化能力，可对查询结果进行趋势识别、异常检测并生成图表，帮助业务人员快速理解数据含义。同时建立了闭环的用户反馈机制，对查询失败、结果偏差或用户修正行为进行自动收集与标注，用于迭代优化SQL生成策略。通过上述技术协同，最终使业务人员无需专业技术背景即可完成跨系统数据探索分析，成功激活全行数据资产，推动数据分析从“IT驱动”转向“业务自主”的模式。

2、“数据整合-提示词-大模型”实现报告生成辅助

在构建智能报告生成类应用时，首先通过整合多源异构数据，确保数据的完整性与一致性，其次根据各类报告结构化模板中包含的固定字段（如标题、摘要、图表位置）和动态字段（如数据区间、分析维度），明确报告主题、逻辑框架及分析重点，通过深度构思并制定高度精准的提示词将结构化的模板转化为模型可理解的指令。最后利用大模型的深度语义理解与生成能力，生成符合业务需求的报告，实现了在审计问题分析、审计整改分析、反洗钱可疑交易分析场景的报告生成，全面提升业务人员工作的效率与质量，技术流程如下图3所示。

3、辅助生成代码与测试用例，提升软件研发质效

基于开源的Qwen2.5-Coder等大模型，通过在IDE中集成代码辅助插件，在编码界面实现上下文感知的代码生成、代码检查与代码解释等功能。同时，以信息系统需求文档和操作界面为输入，自动提取、归纳形成测试点并批量生成测试用例和测试脚本，大幅度提升测试效率，有效降低研发人力成本。AI辅助代码编写包括代码问答、代码编写、代码注释、代码审查等，流程如下图2所示。

4、检索增强构建知识问答体系

传统的文档检索基于词频统计，存在语义理解局限，难以有效处理同义词替换、上下文关联等复杂场景。为此，我们通过DeepSeek大模型拆分策略和拆分模型将用户上传文档进行拆分处理，之后向量数据库将文档片段通过语义模型进行向量化后进行存储。在用户通过智能助手进行询问时，搜索模块从向量数据库中匹配到语义最接近的文档或者文本块，并结合混合检索等技术进行相关度排序，最后大模型将搜索的结果+原始查询语句通过大模型进行归纳总结，生成回答。在信贷申请及审批、反洗钱监测、普惠金融服务等复杂业务领域落地应用，实现了从传统的“信息检索”到“认知决策”的跨越。具体流程如下图5所示。

四、技术实现特点及优势

1、基于统一技术底座研发，实现自主可控体系

大模型平台采用我社“开源模型+分布式技术平台+AI中台”自下而上的信创体系建设。一方面平台开发使用行内统一开发平台确保开发技术栈的相对统一，技术规范、数据标准等的有效落地；分布式技术平台确保各类技术组件、中间件等在运行态的标准统一。另一方面基于我社自研AI中台，大模型开发过程中的数据处理、算法运行、性能评估等步骤，均按照我社应用建模标准规范完成。总之，智能化的大模型平台建设按照我社自主可控的总体技术路线要求建设，不受限于成熟产品和技术绑定。

2、构建异构算力底座，实现算力弹性供给

在大模型平台的建设过程中，创新性地打通并融合了多家算力服务器厂商的计算资源，构建起统一纳管、弹性调度、高效协同的算力资源池。通过标准化接口、虚拟化技术和智能调度引擎，实现了对不同厂商算力设备的池化管理，有效解决了算力孤岛、资源碎片化和兼容性差等问题。不仅显著提升了算力资源的利用率和调度灵活性，有效避免了对单一厂商的依赖，同时也为大模型的训练、微调与推理提供了稳定、高效、可扩展的底层支撑。

3、多个智能体引擎协同工作，满足不同应用场景需求

通过整合机器学习、深度学习、自然语言处理、强化学习等多种智能技术，在面对不同场景复杂的功能任务时，根据各智能引擎的专长进行分配。在信贷、反洗钱监测、普惠金融服务等复杂场景下，通过DeepSeek大模型并结合向量数据库与混合检索等技术，实现深度解析文档并进行智能问答。在反洗钱可疑报告智能生成场景中，通过大模型协同机器学习模型结果，对高风险案例进行深度研判，生成可疑交易分析报告。通过多智能体引擎在不同大模型下的组合应用，满足不同智能化应用场景需求。

五、项目过程管理

项目建设从2024年5月份启动，从智能平台建设、智能场景应用、平台运营三个方面开展工作。一是在智能平台建设方面，搭建多算力服务，构建以Deepseek、Qwen等开源大模型、Dify/Ragflow等开源应用开发组件为核心的平台，于2025年3月完成；二是分批完成智能问答、报告生成、智能问数、代码生成等应用，于2025年4月分批投产上线；三是持续开展大模型平台运营工作，通过对大模型问答数据、应用情况进行持续跟踪和分析，不断优化智能场景。

六、运营情况

大模型平台作为我社AI 中台的核心模块，承担了全行各类与大模型相关的任务处理与服务输出。截止目前，平台累计开发迭代各类智能体应用 20 余个，涵盖金融问答、智能问数、代码助手、报告生成等多个领域，为信贷系统、反洗钱系统、审计系统、数据门户、智能客服系统等10余个系统提供服务，日均调用量达20000余次，平均响应耗时控制在 200ms 以内，保障业务系统高效稳定获取 AI 能力支撑。

七、项目成效

陕西农信依托AI大模型技术，提供知识检索、智能客服、数据分析、报告撰写、代码助手等场景的一站式智能解决方案，并在数据服务、办公、研发、客服等领域的智能化实践中取得显著成效。

（1）AI+数据，提升数据分析效率

智能问数可实现用户通过自然语言提问即可完成数据查询和分析，有效缩短数据获取与分析周期。目前，该应用整合全行指标及报表数据，并支持对数据的历史周期回溯，可实现数据趋势、对比等维度分析与可视化展示，方便业务人员快速使用数据。应用上线以来，周均处理用户自然语言查询近万次，明细降低数据使用者提交数据提取工单的频率，减少使用固定报表的不便，极大提升临时性或者月末、季末等特殊时点的数据分析工作效率。一方面显著缩短数据获取周期，使用户可便捷高效地获取此前依赖科技部门运维人员支持方能得到的数据，显著提升数据分析效率，另一方面，减少了科技部门运维人员工作量，自上线以来按工作量节约运维费用30余万元。

（2）AI+办公，显著提升工作效率

基于AI技术构建的知识检索类和报告生成类应用，解决了以往文档检索功能存在缺乏理解能力、编写各类报告耗费大量人力等问题。通过在信贷、反洗钱、普惠金融、审计等领域深度应用，日均处理知识查询请求超千次，检索准确率超80%。审计报告、反洗钱可疑交易报告可在分钟级完成相关数据总结分析、报告内容生成等工作，培训考题智能编制功能支持用户上传文档后一键生成单选、多选、判断等多种题型，较人工编写时间缩短80%以上。

（3）AI+研发，推进研发活动降本增效

通过大模型驱动的智能数据分析、代码辅助工具、自动测试机器人等应用，以智能化、自动化方式实现研发效率提升，显著降低了人力成本和运营成本，每年预计可节省研发费用数百万元。

（4）AI+客服，提升对客服务体验

结合大模型技术的智能客服系统，能够快速识别客户问题意图,通过语义分析精准匹配知识库，自动生成标准回复话术，辅助客服人员在秒级内给出准确解答，响应效率提升超60%。显著释放人力资源，使客服人员聚焦于高价值事务，推动客服从“被动应答”向“主动服务”的全面升级。

八、经验总结

本项目以人工智能迅猛发展为契机，立足于业务人员高频场景的实际需要，基于Deepseek、Qwen等开源大模型及Dify/Ragflow等开源应用开发组件，构建了涵盖模型运行管理、应用场景开发为一体的陕西农信大模型应用开发框架。项目从知识图谱增强的检索增强生成、大模型多技术融合、大小模型协同和基于开源模型低成本构建应用等方面进行了创新，有效提升了大模型应用开发的广度与深度，降低了业务人员工作负担、提高业务运转效率与价值产出。

陕西农信大模型应用开发平台的构建，是人工智能技术与金融业务的深度融合，项目的成功投产标志着陕西农信人工智能应用迈上了新的台阶，也为中小银行大模型应用场景探索提供了切实可行的落地实践案例，具有较好的借鉴意义。

更多金融科技案例和金融数据智能优秀解决方案，请在数字金融创新知识服务平台-金科创新社案例库、选型库查看。