开篇的话
当下,文化数字化已经上升为国家战略,中办国办专门印发《关于推进实施国家文化数字化战略的意见》进行部署,文化大数据产业界摩拳擦掌,并积极投身文化数字化实践。
文化数字化是新生事物,用老眼光看容易“看花眼”,用老办法推动容易“路走偏”,大家在学习文件、推动实践过程中,会遇到这样那样的问题。
今天推出中国公共关系协会文化大数据委员会副主任高书生对国家文化大数据标准体系的解读上篇。
目标
通过建立国家文化大数据标准体系,实现整合现有的技术和产业资源,统一规划文化大数据标准的发展路线,发挥中国公共关系协会文化大数据产业委员会内部各自企业的优势,协同构建文化大数据的标准体系框架,着眼于未来的标准应用,着眼于布局未来的文化大数据的标准,并充分发挥委员会的价值,高效开展文化大数据标准化工作。
国家文化大数据标准体系建设贯彻落实国务院《促进大数据发展行动纲要》和《深化标准化工作改革方案》精神,高质量推动文化大数据建设,促进文化繁荣,实现如下总体目标:
为文化大数据提供分类、标识与估值的方法支撑,促进文化大数据库建设。
为文化大数据提供生产、传播、服务、消费等技术支撑,促进文化网络平台建设。
为文化大数据的监管提供法规支撑,促进文化产业生态建设。
支撑文化领域国际标准化工作,提升国际文化传播话语权。
配套措施
中国公共关系协会文化大数据产业委员会专门成立了标准化中心,并下设文化资源数据技术工作委员会、文化数字内容技术工作委员会、文化体验技术工作委员会等3个工作组,在组织上为标准体系的形成、完善,以及后续按照体系开展标准化工作提供了组织保障。
标准化中心将逐步深化标准化组织建设、标准化队伍建设、关键核心标准制定、标准化示范验证、国际化标准推进等5个方面,具体如下:
1、组织建设方面应充分利用现有的国内、国际标准化组织资源,构建以中国公共关系协会文化大数据产业委员会为主、跨域协同的文化大数据标准化组织,可以是虚拟的,也可以实体化的,并制定规范的标准化工作机制。
2、队伍建设方面要充分调动委员会成员积极性,通过开展文化大数据标准化技能培训,构建一支兼具技术和管理能力的专业标准化的人才队伍。逐步实现标准化人员培训、考核、发证、持证上岗管理。
3、在关键通用标准制定方面,应分类开展文化大数据的国家、行业、团体等不同层次的标准制定工作,并通过标准宣传扩大行业影响力。
4、在示范验证方面,要凝炼典型的行业需求,形成技术研究和工程建设项目建议,在积极争取财政资金支持的基础上,开展核心关键标准的示范验证,为规模化推广创造条件。
5、在国际化方面,要提出我国文化大数据的国际化标准应对策略,选择已达成国际共识,能促进我国文化国际传播的方向,积极开展国际标准制定工作。
总体结构
除需要引用的技术基础标准外,国家文化大数据标准体系包括如下6个体系:
1、文化大数据基础应用标准体系:包括文化大数据通用标准,主要涵盖文化资源数据和文化数字内容的分类、标识、标注、编码方法等。包括4个子标准体系,分别是:
标准体系:规定国家文化大数据标准体系,包括文化大数据产业生态、标准体系结构图、标准明细表、标准统计表和标准体系表编制说明等内容。
标识:规范文化大数据标识方法,包括并不限于标识编码,以及标识分配、解析等服务流程和支撑系统。
标注:规范文化资源数据和文化数字内容标注方法、流程以及相关的支撑系统等。
分类与代码:规范文化资源数据和文化数字内容分类,以及代码分配方法等。
2、文化大数据监管标准体系:包括开展文化大数据服务所需的监管需求、流程以及相应的支撑系统等技术标准。包括2个子标准体系,分别是:
监管需求:规范文化大数据服务监管职责划分、监管流程等。
监管系统:规范文化大数据服务监管所需的支撑系统。
3、文化大数据资源端标准体系:包括支撑文化资源数据获取及共享的相关流程及支撑系统技术标准。包括2个子标准体系,分别是:
资源数据采集:规范中国文化遗产标本库、中华民族文化基因库、中华文化素材库等文化资源数据的数据采集技术及支撑系统。
资源数据共享:规范中国文化遗产标本库、中华民族文化基因库、中华文化素材库等文化资源数据的数据模型、数据维护、数据共享等技术及支撑系统。
4、文化大数据生产端标准体系:包括支撑文化生产的相关技术以及支撑系统标准。包括2个子标准体系,分别是:
文化生产线:规范文化生产线系统分类及能力要求。
文化生产技术:规范各类文化生产技术。
5、文化大数据云端标准体系:包括有线电视网络为文化大数据各环节提供数据传输通道时,应该满足的组网和服务技术标准,开展文化大数据服务所需的机构设置、支撑系统等技术标准。包括3个子标准体系,分别是:
文化数据服务平台:规范文化数据服务平台能力及各组成系统技术要求。
文化数据服务中心:规范全国、省域、区域等文化数据服务中心的职能、建设、运营等要求。
国家文化专网:规范有线电视网络为文化大数据产业链各类机构提供数据传输通道所需的组网技术要求,以及应满足的服务技术要求。
6、文化大数据消费端标准体系:包括提供文化体验服务的体验设施建设、体验设置运营、体验装备等技术标准。包括4个子标准体系,分别是:
文化体验设施建设:规范文化体验设施分类、建设改造,以及体验装备、驻地网、支撑系统部署等要求。
文化体验设施运营:规范各类文化体验设施运营流程、运营支撑系统以及服务能力评价要求。
文化体验装备:规范文化体验装备分类及技术要求。
文化体验网关:规范文化体验网关技术要求。
文化数据标识技术要求
1、文化数据标识分类:一是文化数据实体标识,是对国家文化大数据体系中的文化数据、参与方、载体、时间、事件和位置等实体的标识。二是文化数据关联标识,是对国家文化大数据体系中文化数据实体关联关系的标识。
2、标识编码原则:一是遵循GB/T 32867—2016国际标准关联标识符(ISLI)标准;二是标识编码具备唯一性;三是标识编码用于文化数据实体及实体关联关系的唯一标识;四是文化数据实体存在既有管理标识符的(如多类各级标准标识符以及馆藏编号等),应使用既有标识符,相应标识符纳入文化数据标识编码的元数据列表项。
3、标识编码申领:编码登记者应向文化数据标识服务系统登记文化数据标识元数据,申领文化数据标识编码;编码登记者应使用底层关联集成系统的应用层工具或文化数据标识服务系统的接口完成文化数据标识编码的申领/登记及嵌入工作。
4、标识编码管理:标识编码由国家文化大数据标识注册服务机构统一负责管理。 在ISO国际标准关联标识符管理体系框架下,国家文化大数据标识注册服务机构是ISLI国际注册机构授权的ISLI区/行注册中心,在ISLI国际注册机构规定的范围内承担本区域/行业的ISLI标识编码注册管理业务。
文化资源数据分类与代码
1、基本原则:
a)合理性——文化资源分类和分类代码逻辑严谨、层级清晰、分类适度。
b)唯一性——文化资源分类和分类代码具有唯一性。
c)实用性——文化资源分类和分类代码能够覆盖国家文化大数据体系的所有文化数据资源。
d)扩展性——文化资源分类和分类代码需要具备良好的可拓展性。
2、文化资源数据分类方法:按照《2009年联合国科教文组织文化统计框架》列出的文化统计领域框架中六大分类,包括文化和自然遗产、表演和庆祝活动、视觉艺术和手工艺、书籍和报刊、音像和交互媒体、设计和创意服务。
3、文化资源分类编码方法:文化资源分类的代码采用七位代码四级分类表示。其中,第1位使用英文大写字母表示第一级分类,第2位~第3位用十进制表示指定二级分类代码,第4位~第5位用十进制表示指定三级分类代码,第6位~第7位用十进制表示四级分类代码。编码采用顺序码,如一级分类以后无二级分类,则第2位~第7位代码的编码用“000000”补齐,如果二级分类下无三级分类,则第4位~第7位代码的编码用“0000”补齐,如果三级分类下无四级分类,则第6位~第7位代码的编码用“00”补齐。
文化数字内容溯源系统
由两大子系统组成,分别为溯源特征标记子系统和溯源监测子系统。
1、溯源特征标记子系统主要为数据层,通过与部署于国家文化专网中的文化数据分发系统对接实现文化数字内容的指纹采集和水印嵌入。数据层主要包括文化数字内容指纹采集、文化数字内容水印嵌入、文化数字内容指纹库和文化数字内容水印库。
2、溯源监测子系统主要分为数据层、应用层和接入层。其中,
数据层通过传播内容采集代理或传播内容采集探针,采集互联网传播平台中传播的文化数字内容的指纹和水印信息。数据层主要包括传播内容采集代理、传播内容采集探针、传播内容水印库、传播内容指纹库、水印库、指纹库和溯源库等功能模块。
应用层,实现文化数字内容溯源所需的各类管理和分析能力。应用层主要包括数字内容特征提取、数字内容信息管理和数字内容溯源分析等功能模块。
接入层为文化数字内容溯源系统用户提供应用界面访问接入能力,并为其他关联系统提供溯源服务接口接入能力。
文化遗产数字化采集技术要求
1、数字化采集服务模型:主要包括数字化采集的人员、工具、对象、流程、数据和评价,其中:数字化采集人员使用采集工具,通过采集流程,对采集对象进行数字化采集,形成数据;对整个数字化采集过程进行服务等级评价,形成数字化采集服务等级。
人员指提供数字化采集服务的工作人员,工具指数字化采集服务中使用的装置,对象指需进行数字化采集的文化遗产,流程指数字化采集服务的阶段、过程,数据指符合采集质量评价要求的文化遗产数据,评价是对整个数字化采集过程的服务等级的评估。
2、数字化采集服务分类:根据对文化遗产的不同数字化采集方式,分为平面扫描数字化采集服务、数字拍摄数字化采集服务、多光谱图像数字化采集服务、显微图像数字化采集服务、可移动文化遗产三维数字化采集服务、不可移动文化遗产三维数字化采集服务、存档音频数字化采集服务、现场声音数字化采集服务、存档视频数字化采集服务、现场视频数字化采集服务。
3、数字化采集服务等级评价方法:用于对服务机构的评价,分别针对每一种分类的数字化采集服务进行评价,分为一级、二级和三级,一级为最高级。等级评价方法按总分值大小进行划分。
文化资源数据解构技术要求(二维图像)
1、定义:将文化资源数据二维图像中具有一定内涵或特殊含义的不同文化元素提取出来,文化元素的提取依赖不同的约束条件,不同约束条件下提取得到的文化元素数量、内涵不同。在国家文化大数据标准体系中,重点解构中华像库(中华图库)、博物馆、美术馆、图书馆、文化馆等公共文化机构的二维图像类文化资源数据,并与采集、标注、关联、重构等关键技术共同服务于生产端。
2、文化资源数据与文化元素之间的关系:文化资源数据由多个文化元素构成,单个文化元素也可以由多个不同文化内涵或更小文化元素构成。
3、流程:解构流程包括图像预处理、解构提取、解构数据标注、解构评价方法 4个环节。解构预处理环节针对输入图像使用数字化、几何变换、归一化、平滑、复原、增强等方法,消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性,最大限度地简化数据,以改进特征表现,增强解构提取的可靠性,用于之后的解构提取工作;解构提取对预处理后的数据,针对数据类型不同,按照对线稿、纹样、色彩解构提取所对应的要求,选择相应的线稿解构、纹样解构、色彩解构等方法进行解构,解构结果输出文化元素;解构数据标注对解构提取出的文化元素,按照文化资源数据标注要求,选择有监督标注、半监督标注或无监督标注等合适的方法,进行语义明确的标注;解构评价采用主观评价、客观评价方法对文化元素质量进行定性、定量分析,根据评价结果优化解构质量。
文化资源数据和文化数字内容重构技术要求(纹样重构)
1、定义:纹样重构是把纹样元素、纹样要素或纹样基因进行组合再创作的方法及过程,并充分考虑各种元素与要素之间联系,结合现代科技,创作和谐、富有文化认同与共鸣的数字内容,符合大众现代审美感,呈现体验达到最佳视觉效果的重构内容。
2、流程:纹样重构流程包括重构预处理、纹样重构、重构数据标注、纹样重构成果评价四个环节。重构预处理环节采用噪声去除、光照平衡、图像增强、平滑等方法对二维纹样图像进行预处理,改善并增强图像的视觉效果,使纹样图像达到数据输入的要求,为后续重构环节提供高质量纹样图像。纹样重构对预处理后的纹样图像,采用群集、组构、层叠和拼贴等不同重构方式对图像中不同文化元素、文化要素进行重构,通过重新构成的方法得到多样的纹样图像结果,输出重构后纹样图像。重构数据标注对重构后的纹样图像,按照文化资源数据标注要求,选择合适的标注方式,以明确纹样图像的属性、来源、重构方式,输出带有标注的重构纹样图像。纹样重构成果评价对已标注的重构纹样图像成果,采用主观评价、客观评价方法对其质量进行定性、定量分析,并输出满足评价要求的成果。
3、纹样重构成果质量要求:纹样重构后所生成的二维图像应满足以下要求,即纹样合理;寓意相融;视觉一致;交互一致;内涵多层;形式美法则;信噪比 SNR>20;峰值信噪比PSNR>30;均方误差MSE<400。
文化资源数据矢量化技术要求(二维图像)
1、定义:将文化资源数据中以二维图像呈现的具有一定内涵或特殊含义的文化元素转换为矢量格式的图形 进行表达和存储,矢量化依赖不同的约束条件,不同约束条件下得到的矢量图质量不同。在国家文化大 数据标准体系中,重点对中华文化素材库和中华民族文化基因库中的文化数据进行矢量化,并与采集、 标注、关联、重构等关键技术共同服务于生产端。
2、流程:二维图像矢量化流程包括预处理、矢量化处理、矢量化标注、矢量化评价四个环节。预处理环节对用户上传的图像做质量优化,为矢量化处理环节提供输入数据,并将优化后图像保存到数据库;矢量化处理环节根据上传图像所属类型选择不同算法做矢量化处理,并生成矢量图,为矢量化标注环节提供入库数据;矢量化标注环节对矢量图进行标注处理,打上标签标出类别;矢量化评价环节对矢量图质量进行评价,得到评价信息和排名情况,方便向用户展示。
文化数据服务中心技术要求
1、文化数据服务中心架构:文化数据服务中心是国家文化大数据体系的枢纽,为国家文化大数据体系的健康有序发展提供各类服务支撑,主要业务内容包括规划服务、保障服务、运营服务、公共服务、产业服务等。文化数据服务中心按照国家文化大数据全国中心(简称全国中心)、区域文化数据服务中心(简称区域中心)和省域文化数据服务中心(简称省域中心)三级部署。文化数据服务中心通常简称为数据中心或服务中心。
2、全国中心:全国中心是国家文化大数据体系运转的顶层枢纽,负责规划和建设国家文化大数据全国一体化数据中心,对接中国文化遗产标本库、中华民族文化基因库和中华文化素材库等国家文化大数据体系各基础数据库,运用大数据、云计算、区块链等技术,执行国家文化大数据标准体系,采用信息与文献关联标识国际标准,建设国家文化大数据确权、交易、结算和支付平台,集成畅通文化生产和文化消费的云平台服务工具等。
3、区域中心:区域中心是依托全国有线电视网络和平台建设的数据中心,上联全国中心,下接省域中心,负责为区域内省域之间的数据、信息、产品等交易和结算提供专业化服务。
4、省域中心:省域中心建设在各省(区市),通过区域中心连通全国中心,负责本地化文化数据的存储、传输和安全保障,链接省域内资源端(本地化数据库)、生产端(数字化文化生产线)和消费端(文化体验体系),为省域内数据、信息、产品等确权、交易、结算和支付提供专业化服务。
5、IT基础设施组成:包括计算资源、存储资源和网络资源等资源。相关资源可以自建或租用方式部署,但应建立灾备系统和数据备份,并采取有效的安全隔离措施,防止基础设施平台内不同客户间的风险传导。
6、安全监测要求:一是对核心资产、各类威胁与违规行为,网络东西向、南北向流量进行持续检测分析,提升网络整体安全保护能力。二是定期检查并及时更新安全产品(软、硬件)病毒库,开启实时防护和定期扫描。三是定期对文化数据服务中心各系统及相关设备进行安全漏洞扫描并及时修补,应及时安装最新的补丁程序,升级防护软件,确保信息安全。
7、安全防护要求:一是对接入信息和数据应实行安全保密管理,提供数据加密保护能力,支持对数据传输和存储进行基于国密算法的加密保护,防止敏感数据泄露。二是提供数据库防护能力,支持发现(或阻断)针对数据库系统的攻击,保护数据库系统的安全。三是提供敏感数据脱敏能力,支持对敏感数据进行实时脱敏,实现敏感隐私数据的可靠保护。四是提供数据水印防护能力,支持在数据使用过程中进行水印标记,实现数据泄露溯源。五是监视并阻断端口扫描、强力攻击、木马后门攻击、拒绝服务攻击、缓冲区溢出攻击、IP碎片攻击和网络蠕虫攻击等攻击行为,数据库服务器应具备必要的入侵检测手段。
8、安全响应要求:一是具备快速响应恢复能力,支持操作系统恢复、数据库系统恢复、网络配置恢复、文件恢复。二是定期进行数据中心各系统及数据备份,可定期做灾难恢复演练,适当提供冗余,确保数据中心系统的可靠性和数据可恢复性。三是具备网络攻击溯源能力,包括攻击主体、攻击路径、攻击方法、攻击对象等的溯源。四是实现安全态势的可视化呈现,从攻击事件、资产安全、追踪溯源、运行监测等多个维度进行可视化展示,提升组织安全管理效率。
文化数据服务平台技术要求
1、文化数据服务平台架构:按照国家文化大数据体系分为全国文化数据服务平台、区域文化数据服务平台和省域文化数据服务平台,三类平台之间通过国家文化专网实现互联互通。
2、文化数据服务平台系统功能:包括用户管理系统、数据管理系统、文化数据确权系统、文化数据交易系统、文化数据分发系统、服务运营系统、服务监管系统、运维管理系统和服务门户等系统功能。
3、文化数据服务平台接口:通过统一认证服务接口发起用户认证信息给文化数据服务平台中的用户管理系统。
4、文化数据服务平台架构:主要由用户管理系统、数据管理系统、文化数据确权系统、文化数据交易系统、文化数据分发系统、服务运营系统、服务监管系统、运维管理系统和服务门户等组成,各系统之间互联实现数据和业务互通。
5、平台安全:遵循GB/T 22239—2019信息安全技术 网络安全等级保护基本要求,并按照国家有关信息安全相关规定,采取相应措施,保证文化大数据的准确性、完整性、可靠性、可信性、保密性、防篡改性。具体要求包括:一是采用资源、角色等权限控制机制,对用户的业务操作访问权限进行控制。二是系统在核心的操作环节应保存日志记录,确保每次操作有据可查。三是采用跨主机多副本的机制来保证数据的可靠性,即一份数据可以分为2~3个副本分布在不同的主机上,当某些主机出现故障无法提供服务时,另外有一个完全一致的副本,业务不会受到任何影响。另外应有带外备份数据保护机制。
国家文化专网组网技术要求
1、国家文化专网承载网络:基于有线电视网络现有网络资源进行组网,可用资源包括有线网络资源和广电移动通信网络资源两部分。有线网络资源主要包括光缆网、传输网和数据网3类资源,其中,光缆网分别为传输网和数据网提供光纤传输通道的同时,为文化数据服务中心直接提供光纤租用服务;传输网为数据网提供传输电路通道的同时,为文化数据服务中心直接提供传输电路服务;数据网分别为文化数据服务中心或直接为业务系统提供数据通信服务。广电移动通信网为文化数据服务中心和业务系统提供无线通信服务,或者通过边缘计算等形式为业务系统提供算力服务。
2、国家文化专网算力网络:为业务系统提供数据共享所需的计算和存储能力,以及通用安全、管理、算法等基础服务能力。算力网络主要由各类文化数据服务中心自建或租用的数据中心算力资源组成,这些资源互联互通形成覆盖全国的虚拟化专用网络,为各类文化大数据运营实体提供透明算力服务。
3、国家文化专网功能:一是为各级文化数据服务中心提供数据传输通道,二是为各类文化机构所拥有的文化机构专网、文化体验设施中的文化体验驻地网、互联网服务商提供数据接入通道。文化机构通过底层关联集成系统接入国家文化专网,实现向文化专网中的文化数据库提供文化资源数据汇聚能力、从文化数据库中获取文化资源数据的能力,以及向文化数据服务平台登记发布文化资源数据和文化数字内容的能力。文化体验设施和互联网通过文化体验网关接入国家文化专网,从文化数据服务中心中的文化数据服务平台获取各类文化数字内容。底层关联集成系统和文化体验网关应具备相关网络的安全接入控制能力。
(本文由高书生根据中国公共关系协会文化大数据产业委员会发布的国家文化大数据体系系列团体标准辑录)
文章来源:伏羲云
热门跟贴