关注我们 -数字罗塞塔计划-

本期直播我们共同见证了无数个精彩瞬间,每一次的互动都凝聚了大家的智慧,在此,我们将对本次直播的内容进行梳理与回顾,旨在总结专家们对于AI赋能档案开放审核的观点与建议。

一、直播回放

回放视频请在数字罗塞塔计划公众号中观看

二、圆桌会议

01.问题一/@华亭科技金晓东董事长

您对人工智能这项技术在各行各业的应用前景怎么看?

金总:相比于区块链、大数据、云计算、物联网等新一代信息技术,我感觉人工智能这项技术带来的推动量级要大的多。之前互联网时代,我们提的是互联网+千行百业,人工智能时代,是人工智能X千行百业,是一个乘法的关系。目前美国的情况是各行各业都在和人工智能开放平台做链接,改变原有行业的格局,优化原有的工作流程,对工作效率带来了很大的提升。国内目前也在积极的跟进中,目前在很多领域已经有比较好的应用典范,比如智能客服,文本报告生成,代码自动生成,数字分身等等,接下来还会在更多的场景中去落地开花。我坚信,人工智能一定会深刻改变我们的世界和我们的生活方式,趋势不可阻挡,人工智能被称为第四次工业革命,相信一定会成为未来社会的核心要素,成为生产力的关键。

02.问题二/@罗塞塔杨安荣博士

在符合我国档案管理要求的网络环境中,有没有一些可以用的成熟AI技术?

杨博士:首先在档案管理中,安全是底线,所以档案部门的网络环境也相对复杂。以档案馆为例,通常情况下就包括三网架构(局域网、政务网和互联网),相互之间还需要按照信息安全的要求进行逻辑隔离甚至物理隔离。

当前最火的AI技术就是大语言模型了,也就是以ChatGPT为代表的生成式人工智能AIGC,但这项技术恰恰是基于互联网的,需要互联网上的海量数据进行训练,这是局域网或者政务网环境所做不到的,所以大语言模型如何赋能具体的档案业务应用场景,比如智能编研,目前还在研究中。

其他相对成熟的技术,比如智能OCR识别(民国档案:手写体、繁体、竖排、字迹模糊)、人脸识别(以图搜图)、语音识别(口述档案)、语义分析(开放审核)等已有较好的应用,更不用说智能安防、智能库房之类的应用了。

03.问题三/@上海市档案局原处长朱建中老师

您能否给我们介绍下您对AI技术在档案行业的整体发展和应用有什么观点呢?

朱老师:人工智能技术作为一种新质生产力,正在与经济社会各领域深度融合,成为技术进步、产业升级、经济转型、社会发展的核心驱动力。档案工作作为各项事业发展的基础,与人工智能技术充分融合已成为必然趋势,人工智能技术在档案行业的广泛应用,必将给档案事业的高质量发展带来新的机遇和新的动能。

一、推进档案管理智能化和提高效率

例如:利用自然语言处理和机器学习技术,可以实现对档案内容的自动分类、标注和一键归档;又如通过OCR识别技术和深度学习技术开展档案鉴定等等,可以极大提升了档案管理的效能

二、提升档案服务水平和用户体验

通过引入智能问答系统和大数据分析和大数据挖掘等技术,档案服务可以实现更加智能化和个性化的服务,满足用户的不同需求和偏好。当然,AI技术在档案行业应用才刚起步,尚处于探索和实践阶段,需要扩大应用研究,总结成功案例和经验,扩大成果推广应用,避免低水平重复。

04.问题四/@泰宇信息罗付军副总经理

泰宇在档案和人工智能结合方面是否有自己的创新之处,具体做了哪些场景应用?

罗总:泰宇在档案的收、管、存、用、治、安上都有一些创新应用场景。

南浔区档案馆的"浔兰诀",利用三合一目录作为归档指引,对档案收集内容进行智能预警、对收集的档案进行智能分类及保管期限智能鉴定等。

嘉善县档案馆把档案的业务过程全部指标指数化,形成各单位清晰的"全息画像",直观的了解到各单位档案业务开展情况,能精准地提供档案指导工作。

泰宇的专利产品"数据保全系统"能实时地对电子档案数据进行监管、预警、保全和修复。

在常山县档案馆通过数据标签化治理、数据挖掘分析、数据聚类等智能手段,自动形成为巡察办服务的多维度专题档案业务场景;在新昌县档案馆也建设了为组织部服务的干部人事专题业务场景;还有浙江省方志办的"浙里有志"及志慧编纂系统等方志业务服务场景。当然还有常见的档案智能检索工具。

我们为温州市档案馆打造的"档案馆智能聚类系统",通过模型训练,能从档案馆海量数据里自动聚类出各种专题,如:碳达峰、碳中和、共同富裕等专题,真正激活了馆藏档案。

连云港档案馆的"档案安全风险监管平台",能及时分析及预警档案馆存在的安全风险;嘉善做的"档案全生命链"能在档案全生命周期内实时了解到档案的安全情况并能进行追溯。

05.问题五/@金总

您觉得AI技术的发展的基础是什么,有什么是我们在各行业应用过程中需要注意的?

金总:AI技术发展的三要素是算力,模型和数据。AI在去年开始有了重大突破,首先是因为算力的巨大提升,暴力出奇迹,因为GPU的万卡集群,让万亿参数的训练成为可能,把多模态实实在在的体现出来;其次是模型,Transformer的注意力机制是语义理解的关键要素,通过对重要性加载不同的注意力权重,把人类大脑的认知过程复刻在人工智能的模型中;第三个是数据,好的数据语料是训练的关键,因为数据,才有了知识,才具备了智慧。

在档案行业的应用过程中,人工智能将对档案的发展产生巨大的影响,过去十年,我们基本完成了档案数字化,目前档案基本上以数字形式存在。在这个基础上,档案的开放审核、智慧检索、智慧编研,各种应用场景可以开始畅想,让档案真正活起来,智慧起来。

06.问题六/@朱老师

任何一个技术的成熟以及应用都离不开环境的孵化,其中场景则是验证最好的方式,所以接下来我还想问一下朱老师,您觉得这些技术用在档案行业中,有哪些合适的场景?

朱老师:AI技术在档案行业的应用场景广泛且多样化,涉及数字档案管理的“收、管、存、用”各个环节。如:

1、数字化成果处理:(1)图像质检(2)条目著录(3)涉密筛查(4)手写体OCR识别等;

2、辅助档案整理归档

3、智能馆库管理

4、档案开放审核

5、辅助档案编研

6、档案智能检索等等方面都有AI 应用的案例。

主要难度是:档案数据落地(标准化数据)和算力、算法的优化,需要在实践中不断优化,提高其准确率。

07.问题七/@杨安荣博士

AI+档案的八大应用场景中,把档案开放审核放在了第一位,这个是刻意而为之吗?

杨博士:这是由市场决定的。

近年来,档案开放工作越来越受到重视,可以说已经成为档案部门的刚需。《“十四五”全国档案事业发展规划》、国家档案局第19号令《国家档案馆档案开放办法》、《档案法》和《实施条例》都对档案开放提出了明确要求:“自形成之日起满二十五年的国家档案馆的档案,经开放审核后无需限制利用的应当及时向社会开放。经济、教育、科技、文化等类档案,经开放审核后可以提前向社会开放”。

但同时,档案开放审核工作量巨大、责任重大、效率低下,远远跟不上时代的要求和社会的需求,这正是AI技术可以发挥作用的合适应用场景。

我们把AI+开放审核放在AI+档案应用场景的第一位确实是为了突出这项工作的刚需性和紧迫性,同时也看好其广阔的市场前景,但并不是说其他应用场景不重要。

08.问题八/@罗总

就档案开放审核这个场景而言,您觉得AI赋能的主要实现路径有哪些呢?

罗总:我们认为,在开放审核环节,AI赋能的主要实现路径还是以强化“人机协同”为主,结合相关的法律法规,人工制定相关的制度、规则和流程,按照这些制度和规则去构建开放审核AI模型,由模型进行第一轮海量初审后,再由人工进行复审判定;最后将人工复核过的结果作为样本再反馈至AI模型中进行算法优化及提升。

09.问题九/@金总

您觉得AI赋能开放审核是否符合您前面说的人工智能前景趋势呢?

金总:AI赋能开放审核是非常符合人工智能发展趋势的,中国是档案大国,五千年的文化传承为我们积累了大量的档案资料,这些档案如何开放,如何才能发挥档案的价值,并且避免产生其他的副作用,AI赋能将在这个领域大有可为。伴随着语言生成大模型的成熟,人工智能对语义的理解越来越精准,开放审核的规则文本也可以作为训练素材灌入模型内部,让大模型具备规则的理解能力和档案的匹配能力,这样的话,很多人工的工作就可以通过大模型自动完成,可以大大节省人力资源,同时避免人工对规则理解的疏漏,避免出错,这将是未来几年的发展方向。

10.问题十/@罗总

关于AI+开放审核的研究,泰宇目前有什么进展成果?

罗总:泰宇最早成立于1996年,只做档案,专注档案业务近30年,公司现在有中、高级等档案专业职称的人员有150多人。泰宇信息从2019年底组建档案开放审核服务团队至今,经过这几年不断探索、实践,逐步构建起“1+1+9”的档案开放审核服务机制,即一套AI智能审核系统+1支专职专业审核服务团队+泰宇特色的“九步工作法”。

以人机协同的服务模式,探索出了一套泰宇的AI开放审核解决方案,在AI技术运用方面,我们注重安全管理,创新推出开放审核的“四性”规则。

目前已经广泛应用于60多家国家级综合档案馆,累计审核档案数量超过2000万件。过程中,我们的算法模型不断得到完善和提升,相信未来我们能提供更高效的、更优质的档案开放审核服务。

11.问题十一/@朱老师

关于AI赋能开放审核您对此有什么看法和思考呢?您觉得对行业的发展会带来什么影响?

朱老师:档案开放是档案工作的重中之重,按照习总书记关于档案工作“三个走向”的要求,国家档案局在“十四五”档案事业发展规划中也明确强调了“加快推进档案开放”的要求,并印发了《国家档案馆档案开放办法》,这无疑让档案工作更加走向开放。

关于AI赋能档案开放审核,我认为这是一个值得深入探讨和积极推行的创新实践。其广泛的应用,不仅体现在工作效率上的提升,更是对档案开放审核工作模式的深刻变革

首先,AI技术通过模拟人类的思维和智能,可以自动化地处理大批量的档案信息,在短时间内完成大量档案的初步筛选和分类,减少了人工操作的繁琐性和重复性,大大提高了审核工作的效率,克服了因档案开放鉴定人才不足的困境。

其次,AI赋能档案开放审核还能提升审核的准确性。AI技术可以通过深度学习和自然语言处理等方法,对档案内容进行精准的分析和判断,避免了人为因素可能导致的误差和偏见。

然而,我们也应该清醒地认识到,AI赋能档案开放审核并不是万能的。在实际应用中,还需要结合具体的业务需求和实际情况进行综合考虑和优化。同时,我们也需要关注到AI技术在应用中可能存在的风险和挑战,如数据隐私保护、算法偏见等问题,并采取相应的措施进行防范和应对。

12.问题十二/ @杨博士

《智慧档案馆室建设指南》,能不能给大家介绍一下目前的进展情况以及AI在其中所起的作用?

杨博士:《智慧档案馆室建设指南》是国家档案局科信司在牵头制定的,有可能作为十五五期间引领和指导全国档案信息化建设的纲领性文件,我也非常有幸参与其中。这个《指南》是2023年国家档案局重点科技项目《档案智慧化发展战略框架与实施研究》的核心成果物。结合课题研究进度,《指南》应该是在今年年底定稿,目前专家组内部讨论已经成型,正计划更广泛的征求意见。

AI无疑是智慧档案馆室建设的核心,《指南》是根据丁司长提出的智慧档案6S架构和20大应用场景为基础来起草的,这其中20大应用场景基本上都是AI+档案的各方面应用,当然也包括咱们今天研讨的AI赋能档案开放审核。

13.问题十三/ @所有人

关于AI赋能开放审核的建议和注意事项。

杨博士:大家在讨论AI技术未来的时候经常会听到一个词“奇点”,这个词不太好解释,但我的理解实际上很简单,就是从量变到质变。那AI赋能开放审核如何才能从量变到质变呢?就是更多的实践应用,让AI模型在实践中积累经验、迭代优化、反馈训练、学习进步,实践的场景越多,加载的训练数据越丰富,机器审核的准确率就越高,最终完全取代人工,那就是达到了所谓的“奇点”。而且这还不仅仅是技术上的“奇点”,同时也是商业上的“奇点”,泰宇公司的AI模型如果到了这个程度,相信也就在档案开放市场一统江湖了。

注意事项主要就是信息安全。AI模型的训练学习需要大量的数据,这不可避免会让公司以及部分核心人员接触到敏感甚至涉密档案数据,这是一道红线,一定要按照信息安全防护等级的要求开展业务,小心小心再小心。

金总:我不是档案行业的专家,对档案行业理解可能没那么深刻,但我是人工智能的坚定信仰者,我相信人工智能一定会改变千行百业,改变行业的生态。AI赋能开发审核只是人工智能在档案行业应用的一小步,但这个一小步也许会是改变行业发展的一大步,方向一定是对的,但在这个过程中,我们也要注意技术的吻合性,了解技术和场景的匹配性,同时把控好投入产出比,控制推进节奏和风险,领先一步是先进,领先两步可能就是先烈了,预祝大家在AI赋能开发审核的掘金道路上都能收获满满,抓住这个难得的发展契机。

朱老师:

1、加强统筹规划,顶层设计,不断优化AI赋能档案开放审核这一业务场景;

2、以业务需求为导向,以项目驱动为核心,加快AI赋能开放审核实践应用;

3、注重隐私保护和数据安全,在利用AI进行档案开放审核时,应严格遵守相关法律法规,确保用户隐私和数据安全,避免信息泄露和滥用;

4、加快专业人才培养,造就一批既懂档案业务又掌握AI技术的复合型人才,同时也要鼓励档案行业与AI技术领域的专家学者、企业等加强合作与交流,共同推动AI在档案开放审核中的应用与发展。

罗总:AI赋能开放审核这一业务场景样本数据很重要,我们要保障在数据收集过程中的完整和真实,又要通过人工不断地对数据进行清洗和质量把控,让我们的算法模型不断地得到提升和优化。档案安全是我们这一业务应用的底线要求,我们一定要严守安全底线,确保档案信息资源安全。希望通过AI开放审核的赋能,让档案在存史、执政、育人上能更有效、有力地提供档案资政服务和群众查档服务。

以上是本次直播间所有内容,数字罗塞塔计划直播间期待更多观点分享,力求为大家带来全新的视角和启发。下期直播已在酝酿中,让我们浅浅期待一下吧~

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

关注我们 -数字罗塞塔计划-