打开网易新闻 查看精彩图片

随着DeepSeek-R1大模型的推出,国产大模型推理能力、自然语言理解能力跃上了新台阶,较低的算力要求和成本使本地部署高性能大模型实现个性化应用需求成为可能,也为审计数据治理现代化提供了动力。审计数据管理是审计数据治理中最基础的部分。以人工智能助力审计数据管理,进而推动审计数据治理科学规范,可以进一步发挥数据要素价值、提升审计质量。

审计数据管理中应用人工智能面临的三大难点

审计数据管理是审计机关对审计数据进行采集、归集、清洗、入库、使用的全流程管理、控制和运用的活动。大量高质量的审计数据,安全的审计数据存储方式,标准化的审计数据采集、归集、清洗、入库方式,以及审计机关丰富的审计方法、审计模型、审计案例、计算机语句等是高质量审计数据管理及应用的 基础。当前,人工智能各类算法模型层出不穷,同时算力成本极大下降,审计数据管理中应用人工智能将深刻影响未来审计方式、审计方法,引起审计效能的重大改变。但审计数据 管理中应用人工智能还存在以下三大难点。

一是数据基础薄弱影响应用质效。审计数据质量、数据共享、数据更新等方面基础薄弱,会导致人工智能发挥作用所需的数据底座不牢。数据质量上,高质量数据欠缺使人工智能对行业规范与优质审计经验的学习不足,导致输出结果的模糊化、幻觉化,难以适配审计场景的复杂性、精确性。缺乏高质量数据的输出结果,进一步增加了审计人员复核压力,降低了审计效率。数据共享上,审计部门之间数据报送、共享通道还有待建设,不同部门之间的数据平台存在物理阻隔、报送规则不一致,数据开放性不够,导致数据流通与使用存在阻碍。不同地区的审计机关之间尚未建立完善的数据共享平台,缺乏对审计部门间数据流转的上级统筹,导致利用优质审计经验的渠道不畅,难以让人工智能充分学习不同领域、不同特征的审计案例,打造更加全面的审计知识库。

二是数据调用量大存在安全风险。为提高大模型的数据治理能力,形成专业化审计知识图谱,需开放接入多领域、多部门、可持续的数据接口。在数据采集与存储过程中,对于线上传输各类公共或涉密数据若无精确的分类及对应的安全举措,将增大泄密风险。随着数据量增加以及数据接口对应部门的增多,对审计数据在不同安全层级平台之间流转的动态保护提出了较高要求。在数据访问过程中,面对海量可调用数据,尤其涉及跨领域的问题时,可能会因大模型对于模糊语义的误判导致越权操作行为,不同权限下人工智能调用数据及其输出结果分类管控的不严密,可能导致以模糊需求超越审计权限输出数据、违规调用敏感数据、隐私数据等情况,同时随着人工智能对于海量数据的学习,所泄密的数据内容也将呈现程度多样、数据量大等特点,造成数据安全风险。

三是专业人才缺乏影响落地效能。当前人工智能处于弱智能向强智能的初期发展阶段,无法做到自主进行大目标拆解,形成工作范式,对于模糊的提示词难以给出精确的答案。为使初期阶段的大模型形成审计思维,需要人工进行训练,并根据审计经验对输出结果进行微调。同时,为减弱大模型的“黑箱”问题,需要既有审计经验又有人工智能技术知识的专家参与大模型的数据治理,对大模型的训练流程、推理输出结果进行复核,把审计经验转化为大模型推理过程中的思维链,将审计职业判断转化为大模型训练中的损失函数,为大模型的使用提供标准化样板,提高大模型在审计领域的利用广度和深度。目前,各级审计机关中具有人工智能专业知识的人才较为缺乏,审计人员对通用人工智能的基础理论与框架,以及所需的集成计算机视觉、自然语言理解、认知推理、机器学习、多智能体等核心领域模型与算法知识的了解十分有限,影响人工智能在审计数据管理中的效能。

审计数据管理中应用人工智能需聚力三个突破

围绕元数据管理、数据质量优化、数据标准建设三大方面聚力突破,从而为人工智能在审计数据管理中的应用打下基础。

(一)应用大模型提高元数据采集管理水平

1. 提升智能采集元数据水平。利用大模型对非结构化数据的处理能力,自动采集各类文件中的图表结构、字段属性等特征数据,将人工经验与人工智能采集进行协同,建立健全自动标注规则,提高元数据的采集效率, 扩充审计的元数据库。

2 . 加强元数据关联分析。结合审计业务需求及大模型的语义理解能力,通过聚类算法将元数据进行分类,形成知识图谱的基础。同时,构建标准化的元数据模型,明确字段定义、数据类型及关系类型,确保不同来源数据可相互操作。人工智能可通过元数据建立数据对象之间的关联图谱,并加强智能检索的效率,降低多源异构数据库等环境下数据关联的复杂性。

3. 以高质量元数据训练大模型。利用高质量标注的元数据提高大模型训练数据的完整性,使大模型在学习阶段自我进行案例生成与扩展,在一定程度上减少大模型训练所 需的样本量。同时,专业领域元数据所形成的知识图谱,可结合大模型的泛化推理能力,推动大模型的跨领域迁移。

(二)应用自然语言处理等技术提升审计数据质量

1. 建立质量规则核验数据真实性。利用自然语言处理技术从现行政策中提炼符合不同业务场景的数据质量评估规则,结合审计人员基于专业领域的职业判断,建立数据质量规则库,对大模型的数据质量评估能力进行训练,形成定制化的数据质量评估体系。

2. 强化复核能力提升数据质量。通过机器学习算法,自动识别数据格式错误、逻辑矛盾及报送缺失等问题,提高数据审核效率。同时,在复核基础上加强对已有数据的特征分析,结合数字分析工具推算出缺失值,实现智能填充,提升数据质量。

3. 结合职业判断提出数据质量改进措施。审计人员通过对大模型产生的数据分析结果进行复核,对分析流程进行监控,保证数据输出的质量。同时,及时反馈分析流程中出现的问题,对后续数据质量提升提出改进意见和建议。

(三)构建智能管理框架加快审计数据标准化建设

1. 对已有数据进行标准化。可构建智能治理框架,建立“基础层(通用大模型)+行业层(审计知识图谱)+应用层(场景化工具)”的三层技术架构,部署数据目录和谱系管理系统对已有数据进行标准化。对于审计领域 已有的高质量数据,如标志性典型性案例的审计工作底稿、可推广的审计经验等,进行标准化处理后作为大模型的训练资料。

2. 对后续数据进行标准化。建立持续学习与自适应机制,统筹公共平台、内部网络的上传数据标准,针对内外部报送数据的标准化搭建跨机构数据兼容框架,在实现部门间互联互通的基础上,建立自动化、全面化的标准监测与反馈机制,将自动化与人工复核相结合,确保后续输入的审计数据能够被大模型识别学习与运用。

3. 对数据调用进行标准化。鉴于审计对数据精确性的高要求,在审计人员层面,要对大模型运用的提示词、参数调整等进行规范,确保提问流程及输出结果标准化。在大模型运行层面,建立动态化的标准差异识别系统,构建支持多模态数据映射的标准适配器,基于最新相关法律法规、审计业务要求,针对性调整数据调用的标准。

审计数据管理中应用人工智能的场景

在三大聚力突破的基础上,充分释放审计数据管理效能,进一步促使审计数据管理在审前阶段、审计实施阶段、审计成果阶段三大应用场景中发挥作用。

(一)在审前阶段辅助数据准备工作

1. 智能化数据处理。审计人员可通过人工智能的图像识别、音频识别技术,解析被审计单位关键文件中涉及的关键条款,将非结构化数据智能转换,自动提取特征字段转化为结构化数据,结合其他结构化数据信息形成 被审计单位知识管理库。还可通过人工智能技术,预设接口自动抓取被审计单位多系统数据(如政务系统、财务系统等),智能识别冗余字段并剔除无效数据,直达核心数据。

2. 智能化风险提示。通过人工智能技术,审计人员可调用数据库,可视化展现被审计单位的运行模式及决策流程等,生成被审计单位画像,直观展示被审计单位的主要业务进展情况及可能存在的关联风险点,提前作出研判,确定审计范围。同时,人工智能可基于内部数据的风险提示,分析被审计单位业务数据的周期性规律,预测重点领域风险,还可参考以往审计查出的问题,构建相似项目审计中发现的违规案例图谱,自动匹配当前项目中的相似特征,对审计人员进行风险提示。

(二)在审计实施阶段辅助数据分析工作

1. 人工智能辅助取数。审计人员可通过相应提示词让大模型生成可运用于数据库取数的代码文本,降低取数门槛,按照审计人员需求以相应的图表字段进行呈现。可基于权限调用,对取数流程实施精准的权限控制,保证数据安全。采取不同权限审计人员对应不同的数据脱敏策略,保存抓取数据过程日志,确保取数的可追溯性。

2 . 多模态数据分析。大模型可通过对特征数据的融合实现多模态数据的协同分析,并根据审计人员的提示词,调用不同数据库内容输出数据分析代码,针对代码展示数据分析的思维链,辅助审计人员进行大数据分析。审计人员可将新获得的数据结合大模型中的已有数据进行交叉检验,分析数据间的关联性与风险点。

3. 证据链智能论证。根据发现的问题以及挖掘问题中调用的数据,人工智能通过结合审计经验知识库,自动链接合同、审批单、银行流水等材料,形成完整的违规证据链与证据关联图谱。通过人工智能交叉核验不同证据源,基于审计法规知识库、审计问题知识库及逻辑推理,比对证据之间的数据差异并提示问题,自动识别矛盾点。此外,还可进行证据效力评级。根据证据类型,结合法规知识库要求,通过人工智能自动标注证明力等级,辅助判断问题定性依据是否充分。

4 . 辅助生成审计工作底稿。审计人员可授权人工智能在本地化部署的审计数据库中调用审计实施过程中获取的数据资料,基于发现的问题点、佐证材料及发现问题的流程日志,将问题描述与相关数据按照上下文的衔接顺序,自动填入固定模板,形成逻辑性较强的审计工作底稿,并匹配相应附件。还可通过人工智能调用审计法规知识库,对输入的审计问题自动匹配相关法规并具体到对应条款,提高法规自动匹配性。

(三)在审计成果阶段辅助数据整理工作

1. 挖掘高价值问题。通过人工智能自动提炼报告核心数据,对发现的问题、涉及的金额等进行归类并生成报告摘要。在此基础上,结合审计人员的政治研判,引用政策知识库的政策目标、审计项目的知识图谱、审计对象的资金流向,形成多维度、可视化的审计成果展示,以多维度数据分析助力问题挖掘。

2. 生成有益经验。基于审计过程中审计人员与人工智能的互动记录、数据调用接口 的操作日志等资料,人工智能可实现对审计全流程的实时记录,并通过自然语言生成逻辑性和可操作性强的审计流程总结,助力生成优质经验,供审计人员参考、助力审计流 程优化,也可作为新训练素材对大模型进行反哺,提高推理能力。

3. 个性化问题洞察。通过人工智能可加强个性行为分析。如在对领导干部开展经济责任审计中,通过对审计对象的历史决策等数据进行分析,建立管理人员决策特征模型, 检测审计对象的异常偏好,预测其在下一任期岗位的行为模式,提示相关风险点。同时,通过调用被审计单位知识库,对被审计单位的决策链条、资金链条、人员责任划分等进行可视化展示,在有关逻辑链上进行问题归因,为审计整改提供参考。

作者:兰健 张斌 陈科宇

单位:浙江省审计厅 浙江省审计科研所

来源:审计观察微信公众号

编辑:孙哲

目前190000+人已关注我们,您还等什么?

打开网易新闻 查看精彩图片