数字全球化时代,将关联数据、知识图谱、人工智能等技术运用于在线藏品数据库建设,是博物馆数字资源服务的一种新兴模式,可促成传统的数字资源服务向“以人为中心”的个性化知识服务转型,以满足公众多样化需求,但同时也对在线藏品数据库的质量管理提出了更高的要求。本文结合故宫博物院数字文物库五年来的建设实践与研究成果,以可持续发展为目标,设计了一个适用于博物馆在线藏品数据库的关键质量框架。该框架的设计与实施,将有助于控制与改进在线藏品数据库的关键质量,为资源服务质量管理体系的构建奠定基础;且能以“需求驱动”的方式推进藏品资源数据的生产、组织与服务在数字化转型过程中明确目标、提升效能并具备可持续发展能力,从而持续优化藏品数字资源公共服务,保障文化遗产数字资源的长期保存与永续利用。

博物馆在线藏品数据库的关键质量框架设计
——以故宫博物院数字文物库为例

方丽瑜

信息和通信技术(ICT)革命促使全世界的数据和信息加速流动,开启了以数据流动为内容的数字全球化时代。随着人民群众生活水平与信息素养不断提升,公众愈发关注博物馆阐释文化价值的深度与方式。如何基于数字全球化视野深入建构、阐释与传播富有中华文化底蕴的中国话语,持续提升中华优秀传统文化数字资源利用水平和公共文化服务质量,以满足多元化的用户需求、推进文化遗产数字资源的全人类共享,是中国博物馆面临的一大挑战。作为面向公众提供资源服务的重要窗口,博物馆在线藏品数据库或藏品资源服务平台正在从传统的藏品“信息服务”向更优质的“知识服务”与“智慧服务”转型,其发展在一定程度上代表了博物馆的数字化转型进程以及藏品数据的开放共享程度,因此其质量管理至关重要,将影响资源服务的过程质量与最终效益。

对于新时期的在线藏品数据库而言,藏品数据多源异构与标准化程度不高、生产智慧数据带来的工作流程变化、开放共享资源数据的格局变革以及多样化的用户需求等,都对其质量管理提出了新的挑战,不仅需要管理平台中愈加复杂多样的资源数据,还需要管理与外部关联的数据和服务,资源数据保存的难度也因此加大,所以一套针对在线藏品数据库的完备的质量管理体系不可或缺,相关研究也正在兴起。本文结合故宫博物院在线藏品数据库——数字文物库平台(以下简称“故宫数字文物库”)五年来的建设经验与研究成果,以可持续发展为目标,设计了一个适用于博物馆在线藏品数据库的关键质量框架,以便为有效提升工作质量和效率提供范式,为今后质量管理体系的建立打下根基。

一 博物馆在线藏品数据库质量管理现状

(一)在线藏品数据库建设概状

如今,博物馆大都搭建了基于万维网的在线藏品数据库,服务重点在于为公众提供藏品数字资源浏览、检索、授权利用等功能,藏品资源来源可分为单一机构和多个机构两种。提供单一机构藏品资源的在线藏品数据库在国内外博物馆中比较普遍,比如敦煌研究院官网的“数字资源”栏目和法国卢浮宫博物馆官网的“Collections”栏目。聚合多个机构藏品资源的在线藏品数据库或藏品资源发现平台为用户提供检索或比对多个机构馆藏藏品资源的服务,比如欧洲委员会的Europeana平台,集合了来自2000多家欧洲文化信息服务机构的5700万余条数据,包括图像、文稿、声音、视频、3D模型等多种模态。

博物馆的在线藏品数据库一般基于分类主题法、元数据法等传统知识组织方法。伴随数字化转型,在线藏品数据库可通过借助关联数据、知识图谱、人工智能等技术,或启动Open Access(开放存取)机制实现与外部环境更紧密的关联,将自己融入万维网的藏品知识网络,实现藏品资源数据从“放在网上(on the web)”到“成为网(of the web)”,这是国际图档博领域增强数字馆藏传播力的革新思维。国内博物馆相关探索起步落后于大英博物馆、荷兰国家博物馆、纽约大都会艺术博物馆、美国史密森尼学会等欧美行业领先的博物馆,虽成果零星个别,但已现亮色,如故宫博物院的数字文物库、敦煌研究院的数字敦煌开放素材库、上海博物馆的董其昌数字人文在线知识展示系统以及中国丝绸博物馆发起的集合了18个国家40余家机构数字馆藏的“丝绸之路数字博物馆”,为公众提供了更开放、适用的藏品数据库。

(二)在线藏品数据库质量管理研究概状

目前大多数博物馆在线藏品数据库还仅采用传统知识组织方法,仍旧是“独门独户”,其数据较少与外界产生关联,虽只需管理自身孤立的数据,但面临整体质量停滞的发展瓶颈。国内博物馆领域尚未形成评价在线藏品数据库质量的惯例,更无相关的通用质量管理体系,鲜少从整个平台的质量管理体系角度对在线藏品数据库建设展开分析,研究重点主要集中在“数据质量”这一维度。标准化是质量管理的重要环节。现今国际博物馆领域的数据标准主要包括元数据(数据结构标准)、编目规则(数据内容标准)、词表(数据值标准)、交换(数据格式标准)以及作业程序标准。欧美博物馆在这一领域起步较早,在领域数据编目标准制定、数据互通共享等方面发展较为成熟,如CDWA(艺术作品描述目录)、DCMES(都柏林核心元数据元素集)、CONA(文物名称规范)等。国内博物馆自20世纪末以来共同致力于制定领域内的数据标准。在藏品信息记录的数据结构和数据内容标准方面,广泛应用的有国家文物局制定的《博物馆藏品信息指标体系规范(试行)》《馆藏文物登录规范》(WW/T 0017-2013)等;数据值标准方面,目前在国家文物局指导下制定的行业标准草案《中国文物分类主题词表》,有利于对文物编目信息的著录进行质量控制。

质量管理是一个系统性工作,数据质量管理是在线藏品数据库质量管理体系的一个关键维度,而从全面质量管理的视角看,用户是质量管理关注的焦点,在线藏品数据库的质量管理必须向前延伸至用户群体,从最初创建服务就应关注用户服务质量标准的制定与实施。但实际上博物馆却并未形成数字服务质量行业标准。“以人为本”是可持续发展的关键,随着可持续发展、高质量发展理念在博物馆领域的深入,博物馆开始转向强调“人”在资源公共服务中的核心地位。比如,故宫博物院将“坚持高质量发展”“以人为本”作为“十四五”发展规划中的基本原则,同时推进整个博物馆全面质量管理体系的构建,其在线藏品数据库建设也注重从全局出发,不光做好数据质量管理,还重视探究以可持续发展为目标的质量管理体系。总而言之,关于资源服务平台质量管理的行业标准与体系的缺失不利于博物馆在线藏品数据库的可持续发展,相关研究亟待开展。

(三)质量管理领域的启示

博物馆在线藏品数据库的质量管理具有领域特殊性,现代质量管理已进入了全面质量管理阶段,可供博物馆领域借鉴的关于质量管理的研究成果非常丰富。朱兰质量体系将质量定义为所有商品和服务都必须是“适目的的”,“目的”是由用户来定义的,并将质量管理过程分为质量设计、控制与改进三个步骤。在吸纳前人成果的基础上,ISO 9000:2015标准将“质量”定义为“一组固有特性满足要求的程度”;将“质量管理”定义为“关于质量的管理”,可包括制定质量方针和质量目标,以及质量策划、质量保证、质量控制和质量改进。

基于上述质量管理标准与理论,结合博物馆行业特点,可将在线藏品数据库的质量定义为“在线藏品数据库的一组固有特性适目的(满足要求)的程度”,其质量管理可定义为“关于在线藏品数据库质量的管理”。质量应是可测量的,才能科学、直观、可视化地描述质量管理,便于发现用户的感受与期望,分析其优势劣势,为质量设计、控制与改进提供更为精准的参考。将整体质量拆解为可测量的质量特性,是质量设计的一项主要任务。为此,本文针对在线藏品数据库的关键质量维度与特性进行分析设计,为搭设相应的质量管理体系作铺垫。

二 博物馆在线藏品数据库的关键质量框架设计与应用

(一)设计思路

1987年,世界环境与发展委员会首次正式阐释了可持续发展的定义——“可持续性发展是指不仅要满足当前的发展需求,而且要考虑不能侵害后代的发展机会”。博物馆的发展与联合国2030可持续发展目标联系紧密。我国已转向高质量发展阶段,博物馆可持续发展被认为是以博物馆高质量发展为目标、更好满足当今与未来社会需求的一种理念。本框架的设计以可持续发展为目标,依照“抓关键、易执行、可持续”策略,通过结合现有研究成果以及故宫数字文物库建设过程中的质量管理实践,对博物馆在线藏品数据库的质量维度与特性进行分析,设计一个易执行的适用于博物馆在线藏品数据库的关键质量框架,重视关键质量的可持续发展,不光注重现有工作的关键质量管理是否易于执行与落实,同时也看重当下所制定的策略、规划是否能为未来长期的发展做好铺垫和提供助益。

(二)关键质量框架设计

在线藏品数据库一般以网络信息系统或网站的形式发布。参考国内外关于信息系统或网站质量管理的研究,发现其重点关注信息质量、数据质量、系统质量、服务质量等多个维度。其中,广泛被应用的D&M信息系统成功模型定义了信息系统成功的三个主要质量指标为信息质量、系统质量、服务质量。从可持续发展视角出发,在线藏品数据库质量管理的对象包括“数据”“系统”“人”“流程”等,评价在线藏品数据库是否具有可持续发展的能力,可体现在可持续发展的数据组织、基础设施、公众参与及作业流程四个方面。因此,可将在线藏品数据库的关键质量维度划分为数据质量、系统质量、服务质量和作业质量四类。针对这四个质量维度提炼分析质量特性,形成适用于博物馆在线藏品数据库的关键质量框架〔图一〕。

打开网易新闻 查看精彩图片

〔图一〕 博物馆在线藏品数据库关键质量框架

1. 系统质量维度

在线藏品数据库的系统质量,指系统软硬件支撑性能的高低程度及系统满足用户期望的程度,反映系统在各种预期或非预期操作场景中的安全、稳定、便利、美观、开放、长期有效的程度。参考GB/T 25000系列标准、《信息系统集成及服务组织 质量管理规范》行业标准以及故宫数字文物库质量管理实践,可将系统质量的评价指标归纳为可靠性、适用性、美观性、长期性四个关键质量特性。可靠性表示信息环境的稳定、安全等可靠程度。适用性表示系统功能可以满足用户需求的程度。美观性是系统质量的外在表现,用于评价开发者在数据库平台的色彩搭配、界面布局等UI设计方面满足用户审美需求的程度。长期性体现系统长期有效的程度,要求系统既能跟随技术变革进行升级或移植,也能有效控制运维成本及提高效率,实现持续运作。

系统质量是衡量在线藏品数据库是否具备可持续发展能力的基础指标。博物馆藏品数字资源是国家和人民的宝贵财富,但作为虚拟之物,若脱离载体,则无法为公众服务,因此保证藏品数字资源长期可靠及适用是在线藏品数据库平台服务与发展的根基。可靠性是识别和管理安全隐患的关键指标,倘若数据泄露或被恶意篡改,给博物馆带来的负面影响无法估量。适用性代表在线藏品数据库可以发展到何种层级,是仅仅成为孤立的平台,还是适用更多的场景。长期性用于评价系统设计是否具备长期发展的可能性。

2. 数据质量维度

数据管理的核心是保证数据的质量。高质量的藏品资源数据是博物馆藏品保管、展览展示、宣传教育、学术研究的优质根基。国内外不同领域或行业根据各自需求提出了不同的数据质量标准和质量维度集。综合分析这些数据质量维度,根据博物馆在线藏品数据库的特点,从数据的形式、内容和效用三个方面出发,将藏品数据质量的评估指标提炼为权威性、适用性、统一性三个关键质量特性。权威性表示数据内容真实可靠、准确权威、可信规范、合理有效的程度。适用性体现数据内容在被检索和利用时可以满足用户需求的程度。藏品数据的统一性表示平台与数据来源的一致程度。

数据质量是衡量在线藏品数据库是否具备可持续发展能力的核心指标。假若数据库中保存过多无法及时同步最新变化的滞后数据,难以保证平台有被继续投入的价值,长此以往,平台被淘汰的风险将加大。权威性是识别和管理数字伦理风险的关键指标,倘若不小心公布错误或敏感数据,博物馆易陷入负面舆情之中。同时,为保证数据质量的可持续发展,在线藏品数据库的数据质量管理并不能仅仅关注平台终端的数据质量,更要把控数据在全生命周期各个环节的质量。

3. 服务质量维度

在线藏品数据库的服务质量可理解为用户感知体验平台所提供的信息服务的“适目的”程度,是非客观的存在。学者们通过实证研究认为信息质量与系统质量直接影响服务质量。参考GB/T 25000系列标准中的使用质量模型、图书馆领域广泛采用的图书馆服务质量评估模型LibQUAL的评价维度等成果,并对应上述系统质量和数据质量的关键质量特性,将在线藏品数据库的服务质量评价指标划分为感知可靠性、感知适用性、感知美观性、用户期望4个关键质量特性,以获取精准的、可计算的用户感知与期望,评估用户满意度,更好地控制与改进服务质量。感知可靠性用于评价用户对系统可靠性和数据权威性的感知效果。感知适用性用于评价用户对系统适用性和数据适用性的感知效果。感知美观性用于评价用户对系统美观性的感知效果。用户期望用于收集用户对于系统、数据的期望值,将其与其他感知特性进行对比或计算可获得服务质量高低的程度。

可持续发展的公众参与是在线藏品数据库存在的根源,因此服务质量也是衡量在线藏品数据库是否具备可持续发展能力的核心指标。因其既能评价用户感知系统质量的效果,又能评价用户感知数据质量的效果,故也是评估基于用户体验的平台知识服务水平的直观指标。

4. 作业质量维度

在线藏品数据库的作业质量是实行全员、全过程、全方位质量管理的重要环节,主要用于约束“开发者”与“过程”,体现在线藏品数据库建设过程中每一位成员开展作业的质量优劣程度以及作业流程设计与实施的质量高低程度,涵盖规范性、协调性、安全性、作业效率等关键质量特性。

作业质量是保证在线藏品数据库是否可以实现可持续发展的关键指标,可以约束和促进参与数据库建设的人员规范作业、高效协作,促进作业流程的设计规范合理、顺畅高效,提升自动化程度、成本效益比率,使人员与流程都有规可依,保障人员、数据、系统皆安全。作业质量越高,意味着整个数字生态运作越绿色高效,越具备可持续发展能力。

(三)关键质量框架在故宫数字文物库质量管理中的应用

故宫数字文物库是国内博物馆具有代表性的在线藏品数据库,于2018年启动平台建设并于2019年上线,实现186万余件藏品总目信息可检索,精选并公布5万件文物的高清数字影像,之后每年增发文物影像并增加新功能,关联“故宫名画记”实现了部分古书画影像的超高清浏览,关联“数字多宝阁”实现了部分文物的三维模型互动,增加按颜色检索图像的功能,嵌入由故宫博物院研发的“中国古代可移动文物知识图谱”〔图二〕增强了文物检索能力。截至2023年8月,故宫数字文物库共发布10万余件文物高清数字影像,总浏览量超3300万次,是故宫博物院官网最受公众欢迎的数字产品,且已成为用户了解故宫博物院藏品的一个重要途径。

打开网易新闻 查看精彩图片

〔图二〕 故宫博物院数字文物库平台的首页 (左) 及 “中国古代可移动文物知识图谱”介绍页面 (右)

作为故宫博物院分享最新文化遗产数字化与业务研究成果的平台,故宫数字文物库质量管理的目标是实现文物数字资源公共服务的可持续发展。故宫博物院收藏文物数量巨大,文物数字资源的采集、加工与公布任重道远,而依照传统技术路径很难达到高效率、高质量的资源开放共享目标。提升文物知识组织与数据传输的自动化和智能化水平,完善数据开放与语义增强策略,是故宫数字文物库改造技术路径的关键手段,这也意味着数据生产、组织与服务的标准、流程都将跟着发生变革,需针对性设计并实施相对应的质量评价、控制与改进方案。因此,笔者所在团队建立了上述关键质量框架并应用于故宫数字文物库质量管理之中,为构建博物馆在线藏品数据库质量管理体系迈出第一步。其中,可持续发展理念始终贯穿于故宫数字文物库关键质量管理过程。

系统质量的可持续发展方面,一是关于适用性,着重改良信息检索这一核心功能的适用程度。二是关于长期性,着手筹备具有长期保存机制的在线藏品数据库框架,如参考OAIS信息模型(Open Archival Information System,开放档案信息系统),以保证数字信息的长期保护和可获取。

数据质量的可持续发展方面,一是保证权威性,重点加强数据规范化管理,参考国内外博物馆数据生产与服务标准与实践,广泛征询不同部门、不同文物领域的专家共同制定数据公布标准,尽可能保证文物数据具备规范的、高质量的特征,以便长期可用。比如,在选取首批公布的文物影像过程中,开发团队制定并依照《文物数据对外公布规则》《影像处理规范》《影像选取规范》等标准进行文物优质影像的精选与加工。二是为保证文物数据的统一性,坚持数据在“源头”改正的单向输出原则,若文物数据需要修改或有最新变化,并不直接在数字文物库进行修改,而是在数据来源平台进行改正后再更新到数字文物库,保证文物数据在各平台间的一致性和及时性,形成从服务终端反向改进源头数据的质量策略,为职工与公众及时呈现最新的、准确的文物保护与研究成果。三是提高适用性,紧跟时兴技术发展,增强语义技术的应用,利用知识图谱技术标注更细粒度、多维化的文物知识描述,为用户精确检索提供更适用的高质量文物数据。语义化是创新文物数据的价值阐释维度与知识组织方式的一种手段,是信息与知识组织的重要发展方向。平台所要管理的文物数据除传统的文物文字与影像数据、影像资源、平台外部资源链接数据之外,还有演进的文物本体知识库等,因此也需为不同类型的数据制定针对性的质量管理方案。

服务质量的可持续发展方面,要点是构建服务质量评价、控制与改进体系,实现可持续发展的公众参与,通过设置用户反馈通道,与用户良性互动,持续获取用户感知体验效果和用户期望等数据作为质量管理措施的重要依据,针对性满足用户多样化需求,改进服务质量,提升用户满意度和忠诚度,如基于用户需求增设三维模型互动、超高清图像浏览等功能及优化交互体验。用户反馈通道主要形式为基于平台的用户调查问卷,问卷围绕服务质量、数据质量、系统质量的关键质量特性进行设计。由于单次问卷不可能对所有质量特性都进行用户意见收集,故将问卷的设计思路定为“持续开展、定期更换”,每一期问卷侧重不同的质量特性。故宫数字文物库的线上用户调查问卷已更新至2.0正式版〔图三〕。问卷的结果对于评价、控制与改进服务质量具有重要参考和指导意义。比如,1.0正式版的问卷结果显示,超过61%的受访者为25岁以下的学生,因此学生群体被定位为问卷2.0正式版的侧重群体,在用户基本特征、访问来源、访问目的等题项增设适合学生群体的选项,以针对性提升服务体验。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

〔图三〕 数字文物库线上用户调查问卷1.0正式版 (上) 与2.0正式版 (下)

作业质量的可持续发展方面,不是仅仅关注平台这一服务终端的作业质量,而是全面把控文物数字资源在全生命周期内的作业质量,涵盖文物数字资源的采集、加工、存储、服务的作业质量管理,以及文物知识的描述、标引、存储、应用的作业质量管理。流程是否持续改进以更合理规范,人员之间、部门之间的协作是否顺畅高效,这些问题都面临一定的挑战,需跳出传统技术方案,创新发展路径。比如,加强平台建设与故宫博物院基础影像采集、文物细编目、文物研究等常规工作的深度结合,建立信息化工作者、文物保管人员、文物研究人员组成的协作开发团队,谋求数据生产与服务步伐协调一致、高质高效。

综上,在故宫数字文物库质量管理过程中,着重执行“抓关键、易执行、可持续”策略,通过优化功能、完善标准、改进流程、加强沟通等举措深化平台建设与核心业务的协作程度,使多方一起有效开展数据、系统、服务与作业等四个关键质量的评价、控制与改进,注重提升各环节的质量与效益,从而初步形成了平台建设与藏品管理、藏品研究、宣传教育、展览展示等博物馆核心业务相结合的一体化协同作业模式。同时,上述四个关键质量并不代表完整的、详尽的质量管理维度,暂可作为在线藏品数据库质量管理的先行指标,逐步推动系统的质量管理体系构建。

三 结论

博物馆在线藏品数据库的质量管理体系构建需要信息与通信技术、市场营销、统计学、管理学、艺术学、博物馆学等众多学科跨领域协作,需要不同部门、不同业务之间建立全局协同机制,具有较高的难度。优先定位关键质量维度与特性,将降低质量管理的难度值,有助于博物馆从全局入手,抓住关键点,采用“分而治之”的方式,对在线藏品数据库关键质量特性的品质把控做到不遗漏、不“偏科”,促进各项标准的建立,全方位地集合各相关学科跟进信息环境与技术变革的脚步,携手突破数字化转型瓶颈,缩小博物馆实际局限与用户需求的差距,既全面保证博物馆当下的质量与效益,也保障中长期发展利益不受损。此外各个质量维度及特性之间存在一定的关联,并非孤立存在。本研究还有待在实践中进一步验证与完善,理清各维度的关系,深度拆解与计算质量特性,为建立合理、完整的质量管理体系奠定基础,增强在线藏品数据库的可持续发展能力,同时以“需求驱动”的方式推进博物馆藏品资源数据的生产、组织与服务赶上数字化转型的列车,不断挖掘、升级与释放数据价值,从而保障珍贵文化遗产数字资源的长期保存与永续利用,在公众与博物馆之间架设富有诚意的沟通协作渠道,使博物馆在线藏品数据库在中华优秀传统文化传播体系中实现应有之举。

附记:本文写作过程中,得到外审专家以及数字与信息部同事的指导和帮助,让我对博物馆数字资源服务有了更深入的思考与理解,在此一并致谢。

[作者:方丽瑜,单位:故宫博物院数字与信息部]

来源:故宫博物院院刊