关注我们 - 数字罗塞塔计划 -

打开网易新闻 查看精彩图片

近期,有网友问“档案数字资源的备份和长期保存是一回事吗?有什么区别?”,笔者虽然从事档案数字资源长期保存领域研究多年,针对这个问题一时三刻感觉也不好回答。正好最近DA/T 99-2024《档案数字资源备份实施规范》刚刚发布,笔者通过对该规范与相关文件的对比研究,结合其他资料的查证,基本梳理清楚了档案数字资源备份与长期保存的关系,分享给大家。

打开网易新闻 查看精彩图片

一、范围界定

首先需要说明的是,本文讨论的范围局限在“档案数字资源”,DA/T 99-2024 3.1中的定义如下:

打开网易新闻 查看精彩图片

从这个定义可以看出,档案数字资源包括电子档案及其元数据,档案目录数据,传统载体档案数字化成果,但不包括档案管理信息系统及其配置数据、日志数据等其他数据。因此DA/T 99-2024 5.4.3中“应对档案管理信息系统及其配置数据、日志数据等重要数据进行备份”的说法实际上已经超出了档案数字资源备份的范畴。

打开网易新闻 查看精彩图片

当然,“档案管理信息系统及其配置数据、日志数据等重要数据”肯定属于数据范畴,应该也属于档案数据范畴,毫无疑问,数据、档案数据和档案数字资源三者的关系是包含关系:

档案数字资源 ⊂ 档案数据 ⊂ 数据

从而:

打开网易新闻 查看精彩图片

二、档案数字资源备份的

特别之处

两年前,笔者曾经写过一篇文章《电子档案备份相对于数据备份的特别之处》,由于历史原因,当时标题用了“电子档案备份”,实际上改为“档案数字资源备份”更加准确。在这篇文章中,笔者得出的结论是:档案数字资源备份可以按照正常的数据备份要求和策略执行,但是着重强调以下四个方面:

01 实现馆(室)藏全部档案数字资源完整备份;

02 离线备份数据要求多套;

03 至少有一套数据保存在异地;

04 对于重要电子档案要求异质备份。

归纳起来就是十个字:完整、离线、多套、异地、异质

应该说这四项“特别要求”或者说这“十个字要求”在DA/T 99-2024中也得到了明确体现:

打开网易新闻 查看精彩图片

上述5.5.1~5.5.3实际上是“3-2-1”备份策略的变种“3-2-2-1”备份策略(有关“3-2-1”备份策略的详细介绍参见本号文章《备份策略从“3-2-1”到“4-3-2-1”》):

打开网易新闻 查看精彩图片

相关要求在国家档案局令第22号《电子档案管理办法》第二十六条、第二十七条中也有规定:“应当在磁介质、光介质、缩微胶片等介质中选择至少两种符合长期安全管理要求的存储介质,以在线方式和离线方式保存至少三套完整数据,每种介质上保存一套完整数据, 一套在线应用,两套备份”、“档案馆应当对重要电子档案进行异地备份”。

另外,虽然数据备份的范畴远远大于档案数字资源备份,但各种数据备份方式也可以应用于档案数字资源备份,如下图所示:

打开网易新闻 查看精彩图片

这其中,红框所示的就是针对档案数字资源备份要求的特别强调部分,即:完整、离线、多套、异地、异质

那么,为什么档案数字资源备份会有这样的“特别要求”呢?笔者认为,这恰恰就是档案数字资源备份与长期保存的关联所在!

我们回过头来看一下DA/T 99-2024 5.4“备份对象”中的描述:“应对长期保存的档案数字资源进行完整的备份”。

打开网易新闻 查看精彩图片

也就是说,档案数字资源备份的主要对象是“需要长期保存的档案数字资源”,或者说是长期保存库中的档案数据:

打开网易新闻 查看精彩图片

有关“四库”架构的说明参见本号文章《档案信息化建设到底需不需要“四库分离”》,其中管理库(接收库、利用库)的备份工作参照常规数据备份的要求和策略执行即可,档案数字资源备份着重强调的“特别要求”主要针对长期保存库。

至此,从档案数字资源备份→档案数字资源长期保存的结论已经出来了:正是因为备份的主要对象是“需要长期保存的档案数字资源”,所以才会有“完整、离线、多套、异地、异质”这样的特别要求!备份的目的当然是为了确保档案数字资源在长期保存过程中的安全!也就是说,档案数字资源备份是实现档案数字资源长期安全保存的重要手段

三、档案数字资源长期保存的

定义与框架

我们再换个方向从档案数字资源长期保存→档案数字资源备份来看一下。

关于什么是长期保存,DA/T 47-2009《版式电子文件长期保存格式需求》中有明确定义:

打开网易新闻 查看精彩图片

有关档案数字资源长期保存的定义和要求,本号已经发过多篇文章,比如《从比特保存和信息保存看数字资源长期保存》《FCLA数字保存金字塔模型解读》《档案数字资源长期保存的“长期”是多少年?》,有兴趣大家可以去查阅,这里不再赘述。

在研究档案数字资源长期保存的定义和要求时,实际上笔者也有一个疑问,就拿最具代表性的FCLA数字保存金字塔模型来说:

打开网易新闻 查看精彩图片

自底向上,一共需要具备七大能力:可获得性(Availability)、可识别性(Identity)、完整性(Integrity)、持久性(Viability)、可呈现能力(Renderability)、真实性(Authenticity)和可理解性(Understandability),为什么没有提到安全性(Security)?

对此,笔者只能理解为确保档案数字资源安全是实现档案数字资源长期保存的前提和基础,如果连数据安全都无法保证,再谈长期保存也就没有任何意义。事实上,关于这一点,《中华人民共和国档案法实施条例》已经作出了明确的要求:

第四十条

档案馆应当……采取管理措施和技术手段保证电子档案在长期保存过程中的真实性、完整性、可用性和安全性

第四十三条

档案馆应当积极创造条件,按照国家有关规定建设、运行维护数字档案馆,为不同网络环境中的档案数字资源的收集、长期安全保存和有效利用提供保障。

所以,档案数字资源长期保存实际上也可以认为是档案数字资源长期安全保存

最后,我们再来看一下档案数字资源长期保存的框架:

打开网易新闻 查看精彩图片

显然在档案数字资源长期保存四层框架中,不管是物理层面的基础设施、存储载体还是逻辑层面的管理软件、保存策略,备份(备份设备、备份载体、备份功能、备份策略)始终贯穿其中,是整个框架不可或缺的重要组成部分。

因此,从档案数字资源长期保存→档案数字资源备份这个方向来看,档案数字资源备份是档案数字资源长期保存框架不可或缺的重要组成部分。

四、结论

综上所述,我们可以得到四个结论:

01 档案数字资源备份的主要对象是长期保存库中的档案数据,其备份要求是:完整、离线、多套、异地、异质;

02 档案数字资源长期保存是确保安全前提下的长期保存,实际上也可以认为是档案数字资源长期安全保存;

03 档案数字资源备份是实现档案数字资源长期安全保存的重要手段;

04 档案数字资源备份是档案数字资源长期保存框架不可或缺的重要组成部分。

当然,备份本质上是计算机领域的概念,其含义非常广泛,和长期保存肯定是相互交叉的,这个不在本文讨论范围之内。

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

关注我们 - 数字罗塞塔计划 -