声明 | 本文版权归国脉互联所有,转载请注明出处
2020年11月26-27日,由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉研究院承办的年度改革创新研讨盛会(第16年)——“2020智慧中国年会”在北京隆重召开,以“十四五前瞻与智治社会建设”为主题,来自全国部委、省、市、区县电子政务、智慧城市、大数据等领域的主管领导、行业专家、企业代表、主流媒体等齐聚一堂。
本文系浙江省大数据管理局副局长蒋汝忠先生于11月27日上午在“2020智慧中国年会” 高级专家研讨会上的演讲。
浙江省大数据管理局副局长 蒋汝忠
以下为演讲内容
一、省市两级平台建设:差异化定位
县里来讲,义乌银行这地方,它县级的公司平台建得都非常好,昨天我看余杭区的公共数据平台叫数据超市,数据超市还获得了这个奖项。这是我们省公共数据平台的一个总体架构,我们把数据归集、数据治理建立在汇集公共的基础数据库,然后从几个方面建设的一个总体架构,我们通过对外的服务,通过三个平台,一个是数据共享平台,数据开放平台,还有一个大数据处理分析平台,对外提供服务。
例如我们的大数据处理分析平台,实际上是为全省所有的应用提供大数据分析的处理。因为大数据分析平台在公共云数据上,它相对来说比较复杂一些,所以说我们很多市级平台里面就没有部署大数据处理分析平台,省级平台的大数据分析处理性比较强,所以大量的批量数据的共享,就在省级平台里边进行开发的业务。
我们共享平台主要是对外各级信用系统提供数据接口服务。还有一个是数据开放平台,数据开放平台主要面向社会开放政府的公共数据。我们浙江大数据质量分为两大部分,一个是公共数据的管理,一个是政府数字化转型。
二、建立从编目到应用的全程闭环管理
浙江数据要素市场这次在改革过程中,我们也在考虑职能的划分,数据要素这块到底是大数据局来管,经信厅来管,还是发改牵头。现在实际上因为国家下来的文件里边对数据要素市场里面三条要求,一条是公共数据的应用,一条是社会数据的应用。
所以公共数据利用由我们数据局来牵头,这个社会数据的利用,现在可能我们是包括整个数据要素的市场化,我们现在建议是在经信部门、信息化部门,就是经济部门来直接牵头。我们建立了从编目归集到治理的共享开放的全流程的一个公共平台。
(一)建立统一的公共数据资源目录体系
1.建立全省统一的公共数据资源目录体系
首先我们建立全省统一的公共数据资源目录体系,我们同志们全面掌握了全省各级的数据库,从省级的角度来说,我们省级的数据信息系统通过这两年的数字化系统的整合,我们公共平台的整合系统从1785套减少到1336套,减少了将近450套信息系统,有些是整个迁移了,有些停用了,还有一些新增的信息系统,整个咱们社会系统目录体系情况。
2.从供需两侧编制公共数据目录
首先就是从需求侧通过核心业务的梳理,重点项目里面核心业务的梳理,建立需求表单,然后通过供需对接。我们现在讲政府数字化转型,从两个方向,一个叫业务数据化,业务数据化的方向就是咱们需求侧怎么来提供,所有的业务需要什么数据。业务数据化这一块,首先梳理业务,和梳理业务指标来,业务指标希望拿下数据第一个过程,然后确定业务的需求清单,这是我们从需求侧来整理编制数据目录。
另外一方面从数据的业务化,现在已经有哪些数据了,然后这些通过看已经有哪些系统了,现在我们全做目录系统里面已经收录了全省78家省级单位, 11个地市的就是5万多类的数据,这个数据项是将近90万项数据项这个方向,建立这个也是一个目的。
3.定期更新维护清单目录
我们这个数据目录实际上是每个月的。每个月定期对没有编目没有归集的数据进行通报和晾晒,准确全省的数据编目情况,归集情况以及逐步的进入空单和数据晾晒,所以说问题数据我们都是整改类、完成类,每个月进行晾晒的通报。我们现在有一个晾晒台,数据晾晒台,在我们一体化政务服务平台里面,我们的一体化政府里面,我们刚才建了一个晾晒台,晾晒台的读者对象都是省领导、各级市县的领导。我们把一些数据的归集情况和治理情况在晾晒台上进行公布,我们建立了省市两级公示目录同步建设体系,我们国脉在里面做了大量的贡献。
通过提供全省统一数据目录、信息系统等对接接口,实时接入各地市公共数据目录系统和省级各信息系统数据信息,提升数据目录的鲜活性、准确性和实用性。我们提出一个口号,就是说数据目录化、目录要全球化、全局动态化,我们下一步的目标是动态要实时化。
(二)构建一体化的公共数据归集交换体系
1.构建一体化的公共数据归集交换体系
我们构建了一体化的公共数据的交换体系,用一些技术叫数据高铁数据管道、数据交换、信息报送等各种类型来形成全省的统一的公共数据交换平台。数据共享方式有两种,一种是实时数据接口共享的方式;另外一种是归集,把需要的数据归集到省级平台里来,我们把各个业务系统数据归集,既归集,又有分布式的数据的共享方式,还有集中式的数据共享方式。有一部分数据是集中到这个公司平台上,有一部分是分散在各个单位数据仓的,所以我们两种数据共享的方式。那么归集的数据现在是归集了将近451条的数据,包括几个重点数据。
2.数据归集的时效性问题
我们数据归集里面也有问题,我们有一种集中模式的数据归集方式,产生什么问题,就是数据归集的时效性问题。
我们现在很大量的应用,比如说 “一证通办”,就凭一个身份证就可以办理民生的事项,就不用其他任何证件了,那么实现这个功能首先要进行数据共享,要利用公共数据平台数据。那么数据共享我们现在像“一证通办”大量的应用方式是通过归集的集中的数据来进行分享,那么归集的数据就产生什么问题?归集的数据的及时性不够。有些比如说办理夫妻条款落户,我们统计了一下办理这件事情需要几个证件,比如说户口本、不动产权证、居民身份证还有户口迁入、迁出的户口本,还有结婚证,就是夫妻考虑落户的话,办理户口入住的话需要结婚证,但是结婚证的归集数据有延时, 12%的数据归集是超过一天的,这数据多一天,如果你今天办了结婚证,你说马上办户口,在楼的大厅里面办就办不了。还有一些比如说执法检查过程中,我们有时候就讲他这个单位已经有食品经营许可证了,去检查的时候你就发现他还没证,你去处罚他的时候他实际上是有证的。我们80%左右的数据原始是归集的数据超过1天的。
3.推进数据高铁建设
所以为了解决数据时效性的问题,我们提出要建立一个数据高铁。数据高铁是什么呢?
数据高铁的建设主要是通过归集的模式把它数据的归集更加高效更加实时,把数据进行归集从“推平台”——就是从业务系统把数据推到公共数据平台,变成了“拉平台”,保证从办公共数据平台,从各个应用系统里下载系统里直接拉数据,保证数据的及时性、完整性和准确性。
同时一个依托公共平台这样的部门,就是实时数据方来实现对数据上的共同监管。
4.核心技术:实时采集数据,又快又准又安全
我们这个技术主要是采用一些流计算在整个“推”改“拉”的技术里面。在实施过程中也碰到很多部门的业务系统,他们也有疑虑,因为部门应用系统担心如果公共数据系统对它有大量的访问的话,就会影响它的系统性,我们也采用一些技术,就不占用生产系统的生产资源,不改变生产系统的业务模式,也不影响生产系统运行。
(1)采用阿里自主研发的 StreamX 引擎,实现数据实时采集,不影响生产系统正常运行。
(2)采用集群+流计算模式,实现海量数据秒级送达,吞吐能力可达 100万条/分钟。
(3)采用插件化架构,实现各类数据源/数据平台快速对接。
5.全省数据高铁通车情况
我们现在的成果是这样,已开通29条数据高铁线——数据高铁是我们一个通俗称呼,实际上就是流计算,接入105个业务系统,604类、184亿条数据,有力支撑政务服务2.0、互联网+监管、基层治理、11个标志性项目、“证照分离”改革等重点应用。
6.数据高铁带来的改变
(1)数据供应链——全程贯通不割裂
链路缩短,环节减少,数据流转链路全程无缝衔接。
(2)部门数据仓——融入平台一体化
依托公共数据平台,建立部门、地市数据仓,实现多租户模式下的一体化平台。
(3)全局统筹、集约建设、分权管理
采取统分结合的模式,全局一套规范,数据集中调度,部门/地方独立管理各自空间。
7.数据高铁应用成效
开通前,12.7%的婚姻登记证数据、65%的出生医学证明数据延迟超过1天。开通后,实现100%数据实时共享,居民办理“再生育审批”事项更快捷。
最简单最典型的一个案例就是办理银行贷款的房产抵押,原来办理半年期抵押房产需要5天时间,现在我们建立了数据高铁,建立了浙江省的金融综合服务平台,当时银行给我们提出来,全省所有房地产单机系统、不动产单机系统的登记信息,抵押各种交易的信息,能不能在三秒钟实施共享。当时我们听到三秒钟的时候,我们觉得有点难度,但现在实际上我们也确实是就8秒到10秒钟之间全实现全省所有不动产登记系统的数据共享,到银行办理也不用原来纸质的抵押证件,实现了中国的数据高铁,实现数据的实时共享。
(三)形成一套闭环运行的数据治理机制
1.形成一套闭环运行的数据治理机制
我们形成了一套闭环运行的数据治理机制,制定了浙江省公共数据治理的公共细则。《浙江省公共数据治理工作细则》建立省市县问题数据反馈整改责任机制和工作体系,实现问题数据“发现—反馈—修正—共享”闭环管理 ;制订数据清洗规则:通用规则(6类一级62类二级)+ 部门个性化规则(4454条)。
2.实现数据“按需治理,应治理尽治理”
浙江数据共享的政策状态和思维理念的状态,我觉得基本上已经不存在问题,现在实际上,数据的质量是是我们数据共享里一个重大的问题。
虽然问题数据比例不高,但对数据应用来说影响非常大,我们每个月通报的问题数据要求各个部门整改,上半年累计发现问题数据2119.1万条, 目前已整改2035.2万条,整改率96.04%,问题数据比例从2019年底0.06%进一步降低为0.03%,这个比例已经很低了,但是这依然是我们数据功能共享中一个很重要的问题。
(四)强化数据共享,实现“按需共享,应共享尽共享”
省公共数据平台提供百亿级别数据运算能力,通过接口共享、批量共享两种方式,主动赋能省域、市域治理现代化,支撑各类应用2151个。
大数据分析系统首先对全省各类系统提供大数据分析服务,通过公共数据共享系统接口共享来提供的,我们现在数据共享机构有1798个数据共享接口。
(五)数据共享赋能省域、市域治理现代化
实际上在浙江整个数字化信息建设过程中,很多基层平台是全省统建的。省级平台提供什么?协同接口和数据接口。请各个市县里面开发什么?开发UI,就是用户结构,直接面向用户的一些应用,由基层直接设计出来。
省级政府的平台提供什么?数据接口和协同接口来赋能县市区部门的UI的开发。当然我们浙江也有一个统一的UI界面就是“浙里办”、“浙政钉”两个端,数据共享,有效支撑了省里一些重大的平台,一体化的政府平台、一体化的“互联网+监管”平台、一体化的基层治理平台,支撑全省的证照分离的改革。
我们有些典型的应用,比如说我们把一些基层的应用,一个社区开通防汛防灾的应用,利用省市公共服务平台的一些应用,实际上它既有省平台的数据,又有市平台的数据,共同形成台州防汛防灾的一个应用。省市两级公共服务平台共同来推动市域的应用。
(六)推动数据开放,激发社会应用创新活力
1.推动数据开放,激发社会应用创新活力
另外我们还推动数据开放,激发社会的应用创新的活力。今年我们开放的数据集9520个,开放数据20.6亿条,网站访问量同比增长118%,下载调用量同比增长116%。数据开放聚焦“四个一”,推进数据开放和应用创新。制度上,出台一部规章——公共数据开放与安全管理暂行办法;技术上,建设一个系统——公共数据平台开放域系统;措施上,举办一场大赛——浙江数据开放创新应用大赛;成果上,打造一批示范应用-可复制、可推广的创新应用。
2.建设一个系统:公共数据平台开放域系统
我们在公共平台上设立了三个域,一个是叫基础域,基础数据域;还有一个叫共享域,就面向政府的共享的数据,把所有的数据放在公共平台上,属于共享域;最后还有一个开放域,开放域是面向社会进行数据开放,开放的数据我们就把它三分,所有政府数据分成三类数据,一类是无条件开放数据,一类是授权开放平台,还有一类当然是不开放的数据,但是开放域系统里面,我们也把社会的数据也放在开发系统里面来,跟政府数据结合在一起,为社会化应用提供服务。
今年我们举办了首届浙江数据开放创新应用大赛,本次大赛聚焦普惠金融、交通出行、市场监管、医疗健康、社会服务保障等五大领域,重点挖掘一批社会效益明显、群众获得感强、有助于社会治理提升的数据开放优秀应用,推动优质项目落地孵化,促进数字经济发展,提升社会治理水平,助力“数字浙江”建设。同时,为丰富细分数据开放应用领域,还设立了“电力数据专场”和“德清地理信息专场”。我们把一些数据开放给饿了么、高德地图、省家政平台、旅游集团等平台。公共服务平台为他们的运营提供公共数据的支撑。例如饿了么所有餐饮公司的资质,我们把食品经营许可证共享给了饿了么;例如高德,我们把省内的所有停车场实时空车位的数据共享给了高德;我们把一些家政人员的信息共享给浙江省的家政服务平台,我们现在请保姆对保姆的资质也需要一个了解,也需要一个后台信息的支撑。
(七)建立健全数据标准规范,强化制度保障
我们在数据开发过程中就注意建立健全数据标准规范,强化制度保障。支撑我们浙江公共数据管理的是两个政府规章,两个省政府的,一个是354号令,就是《浙江省公共数据和电子政务管理办法》第二个就是今年新出台的《浙江省公共数据开放与安全管理暂行办法》,按照这两个政府令,我们又出台了大量的配套的一些配套的文件,包括《省市两级公共数据平台建设导则(试行)》,包括一系列的地方标准,比如说人口数据库的标准、电子证照的标准、信用信息库的标准、法人数据库的标准、公共数据的严格规范、一些目录编制的规范还有一些工作的规范,例如利用数据脱敏实现公共数据的安全,要制定脱敏的技术规范,还有一些具体的操作指南。
三、未来展望:建设全省数据感知系统
我们未来就是公共数据这一方向,我们想要去展望,我们想建设全省的数据感知系统,实时感知、采集全省数据目录,做到目录之外无数据。
全省各级9208套信息系统,我们通过数据感知网络感知到这9000多套数据里面的数据结构的变化,通过感知到的原始数据识别公共数据,然后把它加工出需要共享的公共数据,然后变成可理解的数据。因为现在实际上所有信息系统的数据是它本来的数据表,外人很难看懂它的数据表、表结构,可重用性还是比较差。通过全省的数据感知系统来把最原始的、最底层的数据表变成可理解的数据目录来实现全省公共数据的共享。
我们通过这个理念把数据从发现到采集到交互到利用,全链条做好。谢谢大家。
热门跟贴