关注我们 -数字罗塞塔计划-

美国国家档案与文件署(National Archives and Records Administration,简称NARA)一直在数字档案保存领域扮演着至关重要的角色,其中最为大家所熟知就是电子文件档案馆(Electronic Records Archives,ERA)项目,相关介绍可参考本号文章《数字资源长期保存国际项目巡礼(三):ERA》

当然,ERA是一个综合性的数字档案馆项目,数字保存只是其中的一个功能组成部分。为了应对数字档案资源长期保存的挑战,2017年NARA进一步发布了针对数字档案资源长期保存的首个战略规划《数字档案资源长期保存策略》(以下简称“《策略》”)。2022年6月,NARA再次发布了《数字保存战略2022—2026》(Digital Preservation Strategy 2022-2026,以下简称“《战略》”)。这份文件不仅是对2017年《策略》的修订和扩展,更是NARA在数字保存领域迈出的重要一步。

PART 1

制定背景

NARA作为美国政府档案的主要保管机构,承担着保存、保护和公开美国历史记录、促进公众参与档案利用的重要职责。随着信息技术的不断发展,数字档案资源已成为NARA馆藏的重要组成部分,包括文本文件、电子邮件、航拍照片、图纸、电影、音频和视频文件等。截至2023年10月11日,NARA拥有超过330亿份永久保存的电子文件(总容量达837TB)。这些档案不仅属于公众,更是美国国家历史和文化的重要载体。

NARA鼓励公众访问有价值的政府文件以此来推动国家的公开性、民主性,保护馆藏的数字档案(包括原始数字档案和数字化副本)正是实现这些目标的基础。而《战略》的发布正是旨在保护公民权利、确保政府问责机制并记录国家历史,其在2017年《策略》的基础上增加了战略目标以及“数字保存计划”和“员工培训”两项关键性战略,并对“项目基础设施”、“数据完整性”等部分进行了补充更新,为档案数字化质量管理提供了基础目标与发展方向。

PART 2

主要内容

01、范围

NARA致力于保存和维护对馆藏中所有原生数字档案和数字化副本内容的访问,由档案管理员确定这些文件是否具有足够的历史或其他价值,得以让NARA继续保存。在此策略中,访问是指文件及其内容的持续可用,保持真实性、准确性和功能性的特质对于维护和识别创建文件的目的至关重要。

NARA的2022-2026财年战略计划将“数字保存”确定为该机构的战略目标。其中目标3“最大化NARA对国家的价值”部分指出“NARA将提升对本机构馆藏的现有资产的物理和智能控制,以便在可信的存储库中实现数字保存风险规划和风险缓解,并确保电子文件的持续访问”。

02、关键性战略

《战略》增加了对最新指南和标准的参考,并提出了八项关键性战略来确保数字资产的长期保存和有效访问。

(1)标准和程序文件:

NARA记录了内部程序和标准,适用于原生数字档案、数字化副本和公用副本的生命周期管理。这些程序和标准旨在确保数字档案资源的真实性、准确性和功能性。

(2)数字保存计划:

NARA制定了全面的数字保存计划,包括在整个机构内部就数字保存主题和基础设施需求进行咨询,管理整个机构和生命周期内与馆藏相关的程序文件,分析馆藏的流程和基础设施,识别和管理风险,制定保存行动计划等。此关键性战略是相对2017年《策略》新增的一项,总体计划的制定有利于系统性地管理和保存数字资产,更合理地分配资源,提高效率,以及为数字保存人员提供行动指导。

(3)确定优先级:

NARA采用基于风险的方法设置数字保存优先级,以执行数字保存行动。对馆藏格式进行定期评估,并提醒注意存在风险的格式。

(4)文件管理:

NARA将数字内容存储在基于开放档案信息系统(OAIS)参考模型的数字对象存储库中,并在内容的整个生命周期内对其进行持续管理和访问。

(5)真实性:

NARA将参照ISO 16363:2012标准记录所有数字保存操作,以确保文件的真实性。

(6)保存元数据:

NARA为每份文件分配持久的数字标识符和文件保存元数据,以确保重要的背景、管理性、描述性和技术信息与文件一起保存。

(7)组织关系:

NARA积极与国内和国际数字保存界合作,分享信息和经验,寻求合作并提供指导,共同应对数字保存的挑战。

(8)员工培训:

NARA不断更新各种内外培训模块,为整个机构的工作人员按职责分工提供相应的数字保存培训。《战略》在《策略》的基础上关注到档案人员在数字保存活动中不可替代的作用,提升档案人员在数字保存方面的专业能力,有助于其更好地理解并应用最新的技术和标准,从而确保数字保存活动的顺利进行。

03、数字保存活动

NARA通过以上关键措施来确保数字资产的有效保存,并及时进行灵活的战略调整,保持数字内容的可访问性。此外,NARA还将采取系列举措来进一步强化其数字保存工作,具体包括:升级数字保存基础设施、落实数据完整性计划、开展格式和设备可持续性风险评估等。

(1)基础设施:

NARA设置了馆藏分析、风险管理、存储、网络容量、文件导入工具、格式鉴定转换工具及标准化工作流程等相关数字保存基础设施,以确保数字资产安全高效管理。

(2)数据完整性:

实施数据完整性计划,记录文件生命周期事件,生成校验值验证文件状态,扫描恶意软件以及检查文件哈希值,年度审计文件完整性,及时更换存储介质等。

(3)格式与载体可持续性:

NARA主要通过描述文件特征,制定馆藏文件格式保存行动计划,分析格式和载体过时风险,定期迁移馆藏数据至新介质以及监测技术环境变化等方式评估风险,确保格式与载体的可持续性。

(4)信息安全:

NARA将通过严格控制访问权限,定期审查文件授权情况,确保无非法写入权限,维护操作日志系统等措施对其ERA系统的数字存储库进行持续的安全保护。

04、关键促成因素

实际上,有许多因素将促进或影响《战略》的成功实施,但NARA重点强调了其为实现目标而必须持续关注和解决的关键因素,包括:

(1)组织支持。将数字保存作为战略目标并投入足够资源。

(2)人力资源。合理配置和培训数字保存人员。

(3)基础设施。规划支持数字保存的信息技术基础设施。

(4)为NARA工作人员和机构文件创建者提供标准指南。制定相关技术、格式和元数据标准指南。

(5)数字保存指南和政策。根据技术更新同步制定新的内部指导和政策。

05、审核流程和版本历史记录

数字保存战略将按照与NARA战略计划相同的时间表进行审查和更新。此战略归美国档案工作者办公室(Office of the Deputy Archivist of the United States)的数字保存部门所有。

最初的版本就是2017年发布的《数字档案资源长期保存策略》:

本文介绍的《战略》对2017年《策略》进行了修订,主要修订内容如下:

(1)在“范围”部分中引用NARA 《2022-2026财年战略计划》的战略目标;

(2)增加对2021年NARA《数字保存指定社区声明》(Digital Preservation Designated Community Statement)的引用;

(3)添加对最新《元数据移交指南》(Transfer Metadata Guidance)的引用;

(4)在项目基础设施部分添加数字保存计划策略和随附的参考资料,例如,用于馆藏分析、风险分析以及创建和发布计划的工具;

(5)更新了“数据完整性”部分,增加了对哈希值检查任务的参考;

(6)添加员工培训策略,并更新人员配备的有利因素;

(7)增加可获取组织支持的有利因素。

PART 3

结 语

《策略》的发布为NARA数字档案资源的长期保存和有效访问提供了全面的战略指导和具体行动方案,而《战略》是结合近年来NARA在数字保存中的实践情况对《策略》的补充、改进和完善。

正如NARA在其战略目标中提到的:“在可信的存储库中实现数字保存风险规划和风险缓解,并确保电子文件的持续访问”,NARA将通过《战略》的实施,适应规模、技术和标准的持续变化,确保其数字档案资源的长期保存和有效访问,为公众提供持续可用的高价值政府档案。

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

关注我们 -数字罗塞塔计划-