关注我们 -数字罗塞塔计划-

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

1、热点关注问题一

10月10日,“老雒聊档案”在群里推荐了一篇他的原创文章《档案文化创意产品产业化发展策略思考》,引发了一波群友的讨论。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

楼主

《“十四五”全国档案事业发展规划》所提出的“加强档案文化创意产品开发,探索产业化路径”战略目标。目标如何展开?目标如何实现?个人肤浅理解,仅供参考!

群友1

感觉目前的档案文化创意产品还是太传统,这是面向要C端市场的,抓不住眼球。其实现在文化+直播带货是很好的机会,供给侧不行啊

楼主

文化+直播带货(文创产品)我们团队尝试过,但效果不行,感觉路还很远

群友1

直播不能自己搞,没流量

群友2

个人感觉原因在于缺乏文化口的专业人才和驱动力

群友3

档案文创的入行门槛其实比传统的文博景区类文创要高,不仅需要对档案行业有深入了解,也同时需要专业的产品策划设计运营能力

群友4

文化,目前还是刚刚起步的小市场,但增速较快。

全国规模以上文化制造业企业研究与试验发展(R&D)经费投入由2012年267亿元增加到2022年577亿元,年均增长8.0%。占规模以上文化制造业企业营业收入的比重由2012年0.86%提高到2022年1.33%。2023年国家级广电视听产业基地(园区)实际投资额579.8亿元,营业收入1658.3亿元,分别比2020年增长81.5%、88.1%,年均增长22.0%、23.4%。

群友5

《“十四五”全国档案事业发展规划》提出的“加强档案文化创意产品开发,探索产业化路径”这一战略目标的实现,不仅需要档案部门的努力,还需文化创意产业、科技产业等多方合作,通过资源挖掘、产品开发、市场对接、产业链构建、公众参与和政策扶持等多方面的措施,最终实现档案文化的社会价值和经济价值的同步提升。

群友6

对博物馆景区来说,原本线下的自然流量就很好,所以只需要慢慢迭代,文创产品就能逐渐跑通,但对档案行业来说,设计生产到末端销售这条路原本就更艰难。

群友7

档案馆跟图书馆、博物馆首先存在功能性差异,由于内容较为敏感,场所较为封闭,在进出都需要登记的情况下,人流量首先是一大问题,同时也会影响线上认知和参与度以及购买欲望(认知决定购买需求)。

罗塞塔

今年的诺贝尔物理学奖和化学奖都颁给了AI大咖,AI赋能档案文创前途光明,支持你!《AIGC赋能档案文创设计的尝试》,这条路坚定不移地走下去,终将会有收获!

打开网易新闻 查看精彩图片

2、热点关注问题二

10月12日,有群友问了一个涉及多系统电子会计资料如何归档的问题,群友们纷纷支招。

楼主:

1、记账凭证在财务系统生成;

2、对于报销产生的记账凭证,对应的原始凭证在报销系统中;

3、对于报销单的审批,报销系统会把报销单和原始凭证传给OA系统进行审批。

如果要归档这种会计凭证(记账凭证、原始凭证、报销单审批记录分别在三个系统),该如何处理?

打开网易新闻 查看精彩图片

群友1

记账凭证的元数据中会关联报账单,报账单关联各项原始凭证以及审批结构化数据。归档时以记账凭证维度组件,然后再按账期组卷。

楼主

@群友1,那接收记账凭证时,同步根据记账凭证传过来的报账单信息去获取原始凭证和审批数据吗?

群友1

我们的实践是,记账凭证在ERP系统中,ERP中有归档按钮,触发后会通知关联系统将相关数据推送过来

群友2

从原理上来看并不难,影响归档的主要问题是系统太多

楼主

我一直以为都在一个系统里呢,这还只是一个报销业务产生的会计凭证,就涉及3个系统啦

群友3

3个系统还算好的,我们遇到过17个系统的…

群友4

@群友3,数据不是同时推送到档案系统的,可以t+1,t+2的吧?

群友3

嗯,分散的,不同步的

楼主

那怎么判断数据全到了啊,对每一个接口进行轮询吗?所有接口都接收到数据,才算一件接收完了吗?

群友5

“判断数据全到位”需要结合一定的业务逻辑,可以做系统规则和校验

群友6

对,根据报账报销的类型有业务逻辑在里面。其实电子会计档案管理系统由财务人员组件,他们要审核,一般会应用RPA

补充

随着电子文件单套制归档的推进,现在传统档案人员都不想干了,已经完全看不懂了

罗塞塔

复杂业务场景下的自动化处理,RPA值得考虑!具体可参见本号文章《RPA技术在档案工作中的应用分析》,这篇文章中就讲到了“电子会计资料归档”的RPA应用场景

打开网易新闻 查看精彩图片

群友7

真的要与时俱进

3、热点关注问题三

10月18日,本号发布文章《各种类型电子文件归档格式对比总结》,可以说是一举击中了电子文件和电子档案管理从业人员的痛点,引起了群友们的热议。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

群友1

对于纸质档案数字化成果的长期保存格式,如果采用TIFF的话,像双层版式文件对其中文本的识别优势是不是就没了,还是说通过系统的功能来支撑实现,具体如何考虑的呢?还是说TIFF和双层版式文件都存?

罗塞塔

确实有不少单位保存了多套,长期保存(库)格式、管理(库)格式以及利用(库)格式分别采用不同格式

群友1

这样做是不是重复了?是不是可以双层版式文件里面的图片高清分辨率跟TIFF一致,就可以作为长期保存格式?

罗塞塔

OFD是封装格式,实际内部还是TIFF,那肯定没问题;但如果是双层PDF,这个问题就比较复杂了。

群友2

OFD改个后缀名(ZIP)就可以解压缩。其实可以考虑先按OFD的内部结构把图片什么的排列好,再生成一个OFD文件。

群友3

TIFF本身也可以看做是影像数据的封装格式(可以写入元数据,可以包装多幅影像)。TIFF是OFD要求支持的一种资源格式,对它的特性使用也有一定限制,例如不要使用多幅这一特性等

补充

PDF不能作为长期保存格式,这是有明文规定的,具体可以参见国标委工二函〔2009〕69号:

打开网易新闻 查看精彩图片

罗塞塔

是的,后来国家档案局在此基础上也发了一个文件档函〔2010〕120号,进一步将PDF/A-1的使用范围限制在“涉密文档以及作为档案保存的文档之外”。

群友4

这个是为啥?

群友3

@群友4,记得有个“著名”的口号:自己的鸡蛋不能放在别人的篮子里!

群友5

把PDF一棍子打死现阶段不合理。建议符合长期保存格式特征的都可以选,国产的排在前面优先使用

群友3

@群友5,如果PDF等标准能更“尊重”我国的管理需求/要求一些些,就没必要再搞一套。

群友6

PDF应用太广了,现阶段禁止不了。最新发布的DA/T 103-2024《招标投标电子文件归档规范》中还把PDF/A写到第一个:

打开网易新闻 查看精彩图片

群友7

格式只是“规则制定权、解释权”的一个载体。本质上的需求是,我们作为“超级大客户”,要有一定的规则权,要有执行这一规则的可靠队伍(产业生态)。

群友8

是的,要不然OFD厂商和国家的推动就没有意义了。问题是国内OFD是后起之秀,我们也不能不面对OFD出来之前,五花八门的格式文件容器所承载的数据。

群友9

我觉得坚定不移的推下去(像现在电子发票、电子证照等),倒逼市场把生态做起来,肯定未来至少在中国,OFD作为最通用的版式电子文件格式,肯定是没问题的。

群友10

长期保存用的OFD,直接打包原始的影像600DPI甚至更高,以及元数据(避免两张皮,紧急情况下,拆了硬盘就可以转移)。发布利用场景的OFD,可发挥的空间就大多了,其中的影像可以抽样(至200DPI)、可以压缩,压减文件体积;可以附加OCR结果做成双层OFD,影像供人读,文本供检索或提取;甚至可以在OCR基础上再做精加工,对内容进一步做知识标引,增加业务利用标签。

群友11

我曾是一名档案馆的前线指挥,对于业务工作中的各种实际情况,都必须作出明确回复:比如采用什么样的格式作为长期保存格式,什么样的格式作为利用格式。但实际情况是很难做出类似的抉择

补充

实际操作中的问题层出不穷,比如一卷档案生成单文件放不下,往往要拆分成若干个文件来保存,这时,对于决策者来说,就要考虑文件的命名问题,已有国标、行标缺乏这方面的规定,又要定细则…

群友12

根据“以文件为中心”的“理念”,应用系统处理的数据不要只想着持久化到数据库中,而是要在等效的电子文件中也存一份(人读机读双包含)。这样一来,数据库还要不要归档就可以讨论了,原理上保存好了存有结构化数据的电子文件就可以,有了文件,需要时可以重建出数据库来

4、热点关注问题四

10月20日,有人在群里发起了“关于数据与档案的边界以及数据档案化治理”的讨论,再次引发热议,实际上这方面的讨论已经进行过多次,我们在往期的汇编文中也整理过,但常议常新,本期继续整理。

打开网易新闻 查看精彩图片

群友1

我认为业务数据是档案,业务过程中人工智能产生的数据也是档案!

罗塞塔

这个说法明显存在问题,应该是档案的来源之一;业务数据不一定全部要归档。关于电子数据、电子文件和电子档案之间的关系可以参考《电子档案管理理论与实务》一书第一章中的定义:

打开网易新闻 查看精彩图片

很显然,从数据到档案需要经过归档过程!

群友1

@罗塞塔,没有归档的业务数据是档案吗?没有数源部门确认为档案的业务数据是档案吗?在大数据时代这些问题都是冲击

罗塞塔

档案行业业内人士想扩大档案内涵和范围的想法可以理解,即所谓的泛档案化,也是学术界一直在倡导的,但实际情况下我们还是应该面对现实,先守住自己的阵地。不能荒了自家的田,还想去种别家的地

群友2

可以折中一下,不归档的数据纳入资料库管理

群友3

现在很多地方的档案局馆都在推进馆室一体化建设,不归档数据纳入资料库管理如果是立档单位自己建数字档案室那没问题,如果是档案局馆来做,这个资料库也太庞大了,负担不起

群友4

如果不做馆室一体会面临两大方面的困境:一是大家的数据标准无法统一,数据移交进馆转换成本、沟通成本高;二是累计建设和维护成本高。

补充

统一馆室一体化建设还有个好处,立档单位如果改制了,不存在了,变成死全宗,可以直接通过平台关闭!有新增立档单位可以直接通过平台开通,不用再花钱建设了!

群友5

数据治理应该落实在档案机构,数据局聚焦数据赋能和数据经济,档案机构和数据机构紧密合作。但现实情况是,数据局不愿意搭理档案机构,档案机构也不太愿意搭理数据治理。数据一旦进入档案馆,想用出来,好像就很难了!

群友6

最简单的档案分类,不同的机构分类也不尽相同。放在一个城市的政务平台来看,因为涉及到这么多的业务条线,那就显得有点乱

群友7

档案门类设定,其实要看上游制度的,比如《会计法》、《公文处理办法》、《科技档案管理办法》等,确实现在不统一

群友8

档案实际上是有一套数据治理的理念和方法论,我们在其他行业看,最后仍然绕不过去的是数据究竟怎么组织,怎么管理,包括现在AI的基础仍然是数据治理。关键是如何把这些形成一个系统性的方法论和工具,不仅能够支撑电子档案管理,还能走出去,为其他行业赋能。

群友9

档案部门应该抓主要矛盾,就是档案的来源原则,凭证属性,其他只要关注管理和利用的便捷性就可以了

群友10

我们目前对档案数据治理的理解有两个层面,一个是数据本身的管理,一个是责任以及责任边界的管理,在档案管理中都能体现。而很多其他行业数据治理是单纯的技术部门和技术厂商在落地,会把技术能力放大,忽视其中的管理边界和责任边界

补充

我们在西部省份电子公文领域推动数据的档案化治理,把电子档案的很多做法直接引入电子公文领域,不仅仅是系统设定上搞一个设置,而是能讲清楚为什么要这样管,这样管对电子文件有什么好处,人家电子文件的主管部门听了觉得有道理,都能接受。

群友11

确实,业务数据档案化治理很有意义,这也是档案部门在大数据时代与数据局协作并体现自身价值的重要场景

群友12

业务数据档案化治理不仅要在咱们搞档案的群体讲,更要当好宣传队,做好咨询师,把这一理念传播出去,让更大范围的人知晓。

5、热点关注问题五

10月23日,有群友在群里分享了他自己精心设计的“档案数据归集融合治理一体化”的图,引起群友们的点赞和讨论。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

群友1

这图质量有点高!

群友2

好图!不过这个图感觉环节还可以优化,可以再探讨下。

补充

框架上,是不是可以考虑精简成3个大环节:收—治—用?

补充

具体的改进建议如下:

01

因为这里的“管”环节内容感觉虚化了。广义的“管”是协调、控制。所以收、治、用本身就可以是管的内容;而狭义的“管”这里又没有写出具体的内容。所以“管”要么不画,要么可以囊括3个环节。

02

“存”在这张图上其实也可以不画。因为档案的长期保存的“存”其实已经不在这个链路上了。而且这里突出融合治理一体化,感觉不画会更聚焦。

03

“检”是“治”的一部分(当然档案的收里面,因为移交接收的缘故,也包含了交接环节的“检”。这个“检”就是“收”的一部分内容了)。“治”是一个PDCA动态、持续性过程。所以“检”本身就是“治”当中的一个环节,而且是个持续性、常规性的动作。另外,“治”里面还应该加一个“评”的环节。

04

这样改了之后,一方面,使得“收”、“治”、“用”三个环节得以突出(这三者本身就相对于传统的档案管理有很大的变化和创新。)另一方面,在这个框架下,还可以进一步充实三个环节的子标签和内容(比如上面提到的“检”、“评”)。

群友3

档案数据治理的概念混杂不清,有必要澄清一下。实际上,GB/T 34960.5-2018《数据治理规范》中对数据治理框架有明确定义:

打开网易新闻 查看精彩图片

楼主

大数据管理先收,后治,再用,档案在收前就定数据标准,后面的治跟大数据的治实质上是不一样的。数据档案化治理维护的是数据可信,大数据的数据治理是数据元的编制

群友4

数据治理肯定是包含数据标准的,这在DAMA车轮图和DCMM(数据能力成熟度模型)中都有明确定义。

打开网易新闻 查看精彩图片

楼主

我看到的数据治理,元数据方案的数据标准设定通常用于数据归集后的数据治理。档案管理的元数据方案通常在于数据归档前

群友5

所以在这个多元化世界,传统视域下以文本为主的“档案”作为唯一可信地位可能会被弱化,对于行业内的人,是一个比较危险的信号。

补充

如何丰富和完善“档案”的外延是关乎未来行业发展的大事。这样看来,所谓的“数据档案化”的确是值得行业迫切普及和推动之事。

6、其他问题拾萃

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

1、请教下,大家用什么品牌的机械硬盘做备份呢?一般多大容量一块?

品牌基本上只有西数(Western Digital)和希捷(Seagate),容量常见的从1TB到12TB都有。

2、请教一下各位领导专家,电子公文归档的定稿必须没有红头吗?以前线下发公文都是先起草,定稿了再套红头,所以归档的定稿都是没红头的。最近我们单位在迎接检查的时候,检查组提出电子公文的定稿也不应该有红头,就有点迷惑。

正本肯定是有红头的,至于定稿有没有红头要看这个稿本是在套红之前还是之后,如果是在套红之前确实没有红头。按照你的说法,只能说流程有问题,应该是先定稿再套红,这样定稿就不带红头。但肯定不存在套了红头还要求去掉的情况。

3、请教一下各位,现在市面上有没有成熟的硬盘检测仪器设备?

推荐硬盘哨兵(Harddisk Sentinel)软件,可以检测硬盘健康情况。

打开网易新闻 查看精彩图片

4、咨询各位大咖,针对磁带库房,周边磁场强度有没有相关标准要求?

库房要求没有,但可参考GB/T 2887-2011《计算机场地通用规范》表3:

打开网易新闻 查看精彩图片

5、大佬们,想问下,从业务系统进行归档数据对接到完成归档,怎么才能将传过来的数据直接归到某个类目上?我们现在手工选,操作太麻烦啦!

这个过程至少需要解决两个问题:一是业务系统和档案系统的归档接口问题;二是“三合一”表嵌入归档模块的问题。这两个问题的解决都涉及到系统功能改造。具体可参见本号的两篇文章《电子文件归档接口方式分析及应用实例》《如何自动或半自动地开展电子档案收集?》

6、国家档案局令第22号《电子档案管理办法》第十七条规定:“党政机关电子公文归档,应当去除电子印章的数字签名信息,只保留印章图形。其他组织机构电子文件归档可以参照处理。”如果不想进行“去技术化”处理,有没有好的建议?

在《电子印章管理办法》出来之前,可以参考GB/T 42133-2022《信息技术 OFD档案应用指南》中的规定。

打开网易新闻 查看精彩图片

7、各位老师,有没有“三合一”结合AI的实际应用案例?

只需要将“三合一”表直接嵌入归档模块即可,根本不需要AI。具体实现方式参见本号文章《如何自动或半自动地开展电子档案收集?》

打开网易新闻 查看精彩图片

8、请教下:电子档案全生命周期,是否包含电子文件(收文或发文)在OA办公平台的形成阶段?

关于电子档案全生命周期的定义,比较权威的说法可以参考《电子档案管理理论与实务》一书的第四章第一节,图示如下:

打开网易新闻 查看精彩图片

更为详细的介绍可以参考本号文章《电子档案全生命周期管理流程》

9、请教各位大佬,单个OFD和PDF文件有文件大小限制吗?

文件大小的限制更多是取决于操作系统(文件系统)对于单个文件大小的限制。比如32位Windows系统的常见文件系统FAT32,单个文件最大不超过4GB;而64位Windows系统的常见文件系统NTFS,单个文件大小限制已经提升到2TB。OFD基于ZIP压缩,同样也受制于ZIP32或ZIP64的文件大小限制。但是PDF格式除了受文件系统限制之外,网上说Adobe公司限定了单个PDF文件的大小不超过10GB(未经测试)。

10、如下图所示的收据存根怎么归档?

打开网易新闻 查看精彩图片

纸质存根联次另行装订组卷归档,记账联同相关的记账凭证按照会计档案组件组卷归档。

11、请问一下,设备变卖处置后(资料没有随机处置)这些设备的资料可以销毁吗?

应该可以销毁,但还是需要发起销毁鉴定流程,留下同意销毁的相关记录。

12、请问DA/T 70四性检测的这个指标是以什么为标准,确定系统环境是安全的?

打开网易新闻 查看精彩图片

主要就是看系统环境是否达到等保或者分保要求,通过等保或者分保测评就是最好的依据。

13、请教各位专家,电子档案在存储时,可否进行压缩存储,这个问题可有相关的依据?

《电子档案管理办法》第十七条规定:“电子文件及其元数据归档不得采用非开放的压缩、加密等技术措施。”这里虽然讲的是“归档”,但“存储”也是一样的,可以压缩,但不能采用“非开放”的压缩技术。

数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

关注我们 -数字罗塞塔计划-