王建冬国家发改委价格监测中心副主任

以下观点整理自王建冬在CMF宏观经济热点问题研讨会(第83期)上的发言

本文字数:5319字

阅读时间:14分钟

2019年10月,十九届四中全会首次提出将数据作为新的生产要素,纳入收入分配的序列。收入分配制度改革是贯穿我国改革开放始终的核心命题,中国根据不同阶段经济发展的特点,逐次将资本、技术、管理和数据等纳入按要素分配的序列之中。其中,前几种要素都是顺应工业化、城镇化发展要求,在学习借鉴西方经验的基础上形成的改革成果。而数据要素分配是工业经济向数字经济转型中最具时代特征的新鲜事物,是我国在国际上首先提出的重大理论和实践问题。当前,随着国家数据局的正式组建,我国数据要素市场化配置改革相关制度建设开始步入快车道,但困扰行业发展的三大关键问题依然有待解决。

一、以“三权分置”为起点,如何实现数字化时代的新型共同富裕?

与传统要素相比,数据在生产、流通、使用过程中,个人、企业、社会、国家等相关主体对数据有着不同的利益诉求,且呈现复杂共生、相互依存、动态变化等特点。数据整体的权利谱系可以分成个人、平台和国家三个层面,分别对应个人人格权、企业数据财产权和国家主权三个方面权利的诉求。“数据二十条”的一个重大贡献,是将数据所有权和使用权进行了区别,在目前制度和技术条件下,难以完全解决数据所有权归属问题,转而关注数据的使用权并将其进行拆分。这种思路可以类别于其他要素的产权制度改革,如土地所有权归国家不能转让,但土地的使用权和经营权可以进行分离和流转;人才的所有权也无法交易,但可以对人才特定时间、特定用途的使用权和收益权进行交易。基于此,“数据二十条”提出了“三权分置”的基本思路,构建以数据使用权为导向的权利束体,分成数据资源持有权,数据加工使用权和数据产品经营权。这里的持有和所有是完全不同的概念,以滴滴打车数据为例,其所有权难以说清,但持有权应当属于滴滴平台,因为消费者和平台之间有协议约定,且数据的实际控制方是平台,这就把目前的数据产权不清晰问题进行了阶段性处理。

按照这一逻辑,可根据来源方和处理方将数据产权分为两段:流通和使用阶段包括持有权、使用权和经营权,这一阶段要保护数据处理者的合法权益;生产阶段要保护数据来源者的合法权益,并通过知情同意和法定事由两种渠道确定数据持有权的归属。例如上面说的滴滴的案例,就属于知情同意;再如税务部门有依法履职的职能,所以拥有对纳税数据的持有权。

从顶层来看,《民法典》将民事权利分为人身权、物权、债权、知识产权等,未来有可能要加入数据权,并与其他民事权利并列。数据权和物权、债权、知识产权等均有一定共通性,但也有其独特性,所以民事权利的改革是一个复杂的长周期问题。中国人民大学熊丙万老师对数据的持有权、使用权、经营权进行了进一步拆分。数据的持有权分成自主持有和委托持有两类,数据经营权则分成了整体转让、许可使用、融资担保、投资入股和合作加工五类。

在基本的产权逻辑之下,目前还存在一个比较有争议的问题。那就是在共同富裕背景下,如何更好更全面地保护数据来源方的权益?从《个人信息保护法》角度来看,数据开发利用不能妨碍个人的人格权,需要保护隐私、确保数据匿名。但进一步来看,如果企业通过个人数据进行开发利用后获得收益,个人是否能够分享一部分收益?关于这一问题目前没有很好的解决方案,但行业界有很多探索,比如通过数据信托、共票(Coken)理论、Web3.0、标准化采集合同等新的技术手段来保障来源方的权益。

一种思路是通过信托这一制度工具来实现。“数据二十条”提出探索企业和个人数据受托机制,未来可以通过信托机制帮助个人和中小微企业与大的平台公司形成权利博弈,从而实现合理的收益分配。去年深圳数据交易所联合中诚信托发布了“中诚信托数据资产1号财产权信托”产品,围绕数据信托进行探索。日本也在个人数据信托方面进行了相关尝试,例如日本信息银行。

另一种思路是数据资产权益的通证化(Coken)。对于相对传统的物品,通过一次交易可以把权益进行清晰地转让,供买方使用。但数据的交互环节非常漫长,交易之前的数据清洗治理、隐私保护以及交易后的共享流通和应用都需要买卖双方共同合作进行开发和利用。中国人民大学杨东老师提出交易是短链条行为,而数据要素价值的实现是长链条,这就产生了错配现象,所以完全通过交易的方式可能反而使得数据流通是不经济的,对于大部分数据持有方而言,其理性选择是自行使用数据,不进行交易,这是影响目前整个数据要素流通市场培育的重要问题。所以,杨东老师及其合作者认为可以通过“共票”方式,基于区块链技术对数据价值创造过程中的多元主体从来源方到交易方到加工治理方、应用方等各方主体共享进行统一标识,把数据权益通证化,通过区块链的方式形成激励机制,这可能是未来解决数据资产权益流通和共享的一个重要方向。2023年12月14日上海数据交易所发布《数据资产通证化上海路线图》,提出了数据资产通证化的基本概念,并提出构建基础设施DCB(Data Capital Bridge),即数据资产“一桥、两所、两轴”架构。实现资产权益通证化更综合的解决方案则是Web3.0,其包括“跨平台漫游”、“数据权利归个人”、“没有中间商赚差价”、“去中心化自治”等特征,可以在很大程度上解决目前的数据产权困境,但在实践中依然还有很长的路要走。

二、如何处理数据产权与数据知识产权的关系,实现数据资产“大入表”?

2023年8月21日,财政部制定印发了《企业数据资源相关会计处理暂行规定》,自2024年1月1日起施行,为企业数据资产入表以及后续的资本化操作开启了一扇大门,引发各方广泛关注。但在具体实践中我们发现,本着审慎推进的基本原则,财政部目前颁布的《暂行规定》是在没有突破现有会计准则和计量基础前提下的一次有益尝试,是一个“小入表”的方案,短期内并不会带来大量企业数据资产确认。原因是入表对象是“数据资源”,而在数据要素市场中,真正拥有原始数据源的企业并不多,绝大多数企业是从事为数源型企业提供数据治理、加工、处理、建模等服务的企业,其受委托持有大量数据资源,但是其并不具备原始数据资源持有权,因此难以有效入表;而这些企业拥有的大量与数据相关的模型、算法、工具、平台等数据资产,又不在《暂行规定》的入表范围之内。未来应当积极尝试从“数据资源入表”走向“数据资产入表”,逐步实现“大入表”。

要解决这一问题,核心是要回答清楚“数据产权”和“数据知识产权”这两大体系之间关系的问题。近几年各地积极进行数据知识产权试点,有学者认为,从客体性质、权利内容趋势、知识产权制度包容性来看,数据产权和知识产权的关系非常接近,我们应该借鉴知识产权的制度建立数据产权的规则,这是最适宜也是目前制度成本最低的方式。

我们认为,需要基于数据的开发链条探索数据产权转移这一综合性问题。“数据二十条”中提出了三个权利,其中第一个权叫做数据资源持有权,第三个权叫做数据产品的经营权,从数据资源到数据产品是一个数据开发利用的链条转移,这意味着单纯的数据变成了数据、算法、算力的结合体。其中,产权转移通过两条路径实现:一是从原始数据变成了开发利用后的数据,即从D变成了D’,这里存在数据产权流转的问题;二是依附在这些数据之上的算法模型,即数据知识产权。据国家知识产权局的解释,数据知识产权和版权、商标权、专利权未来可能是并列关系,作为第八种新的知识产权的形态。目前,很多中小企业数据开发利用过程中的主要贡献就体现在数据知识产权的生产上,所以登记数据知识产权是一件非常有意义的事情。未来,构建统一的数据产权登记管理制度是数据要素市场的基础性保障制度,从历史经验看,任何一种要素市场得以发展的前提是完善的产权登记体系。一个理想化的数据产权登记方案应该是把数据产权(包括数据资源持有权和数据产品经营权两个层面)、数据知识产权,以及依附在数据之上的个人信息(人格权)等多种要素综合起来,形成全国统一的完整产权登记体系。

从企业数据价值链的角度,企业将数据资源加工成为数据产品,实际上就是把算法和算力叠加到数据资源之上的过程。因此,实现企业数据资产的“大入表”,可以区分为数据入表(包括其衍生数据和中间数据)、算法入表(可遵循数据知识产权登记和无形资产入表的路径)和算力入表(即支撑数据资产运行的各种硬件固定资产入表)三部分,这样就具备较大可操作性。

三、如何建立数据要素价格机制,有效激活十万亿级新型数据资产市场?

短期来看,数据基础性制度将催生3000-5000亿元规模的数据交易市场。中长期看,数据资产化催生的相关市场潜在规模将达到十万亿级。深圳市统计局按照国家统计局的要求从2020年起对全市规上企业数据要素投入进行核算,按照支出法,2021年全市规上企业数据要素支出规模超过千亿元。如果按照深圳规上企业总产值占全国的比重简单推算,则按照支出法,全国数据资产潜在规模将达到10万亿级。清华大学戎柯团队通过测算也认为,2020年全国数据资本存量17.4万亿元,数据资本形成额4.4万亿元,两者相加21.8万亿。2011-2019年,数据资本对经济增长率的贡献约为34.46%,仅次于资本,是贡献第二大的生产要素。所以,数据要素市场是一片十万亿级的广阔蓝海。

但理想很丰满,现实很骨感,目前我国数据要素市场竞争“白热化”和资源“碎片化”并存。据不完全统计,全国各地各种数据交易中心交易所上百家,以交易所命名的持牌机构超过9家,但许多数据交易中心的生存状态并不理想,主要是因为全国统一大市场还未真正形成以及定价问题。2023年5月,2023年中国国际大数据产业博览会“数据要素流通与价值化”论坛举行,梅宏院士曾做了一个“十问数据要素化”的发言,其中关键一问是数据能否实现标准化定价?他提到,数据都有经济价值,但是不是一定能带来经济价值是不确定的,带来多少也不确定,是否可计量都存在问题。不同行业的人对同一个数据的需求,或者对它的价格认知是完全不一样的,所以传统资产评估方法很难适用于数据资产评估领域,也很难形成统一的价格标准。但如果数据作为一种生产要素不能实现标准化定价,那么整个要素市场化配置和收入分配就缺乏逻辑基础。

基于以上问题,我们提出了三点基本思考。

第一,数据并非是纯粹的非标准化定价。数据资源本身并不直接创造价值,数据在不同应用场景中实际上都是以“数据产品”的形态体现出来的。而在数据产品中,除了“数据资源”之外,还有凝结在数据之上的两部分投入,一是智力、品牌等无形投入(这部分可以统称为算法投入,或国家知识产权局提出的“数据知识产权”);二是网络、计算、存储等有形投入(这部分可以统称为算力投入)。前者属于无形资产,在不同场景中算法无形资产的价值评估具有很大灵活性,也是造成数据“千用千价”的核心原因。而刨除这部分,数据价值、算力价值的估算应当是相对标准化的。这就像同样的菜和调味品,在五星级酒店大厨手里炒出菜和在路边摊炒出菜的价格完全不一样,这里面的价值区别不在于原料,而在于饭店的“品牌价值”和厨师的“知识产权价值”具有差异性。

第二,非成熟市场的价格形成需要政府介入。价格是市场主体间价值交换的最重要媒介,其表现形式是围绕着商品价值的上下波动。当价格标准确定以后,各经济主体通过价格体系将社会资源的价值和人们的选择转化为生产、交易等活动,最终实现社会资源的合理配置。但是,由于市场机制天然具有滞后性、自发性和盲目性等缺陷而诱发的宏观经济不稳定、微观经济低效益与社会分配不公平等市场失灵现象客观存在,使得人们开始考量市场机制作为社会资源唯一调控方式的合理性。在一些非成熟市场或特定场景中,政府介入市场干预价格成为必要和必需——当前数据要素市场就是这样一个容易产生“市场失灵”的领域。

第三,公共数据应当成为全社会数据定价的锚。“数据二十条”的一个基本观点是公共数据要实行政府指导定价。克强总理在2016年贵阳数博会上提出,中国超过80%的数据在政府手中。据2022年中央网信办《国家数据资源调查报告》,政府和以国有性质为主的数据总量超过60%,即目前超过一半的数据属于公共数据。如果对这部分的数据通过政府指导价形成一个定价基准,就可以为社会数据和个人信息数据价格形成提供参考标准,这是未来一个可能的价格形成路径。

针对以上三个基本思考,我们进一步提出三个解决方案。

第一,构建数据要素的多级市场体系,一级市场是数据资源市场,二级市场是数据产品市场,零级市场是非交易流通市场,即数据交互市场。基于三级市场分类,对不同市场的价格形成采用不同的方法进行引导,建立三级市场联动的新型价格机制。例如,一级市场定价以成本法为导向,实现相对的标准化定价;二级市场定价以收益法为主,评估因素除成本外,重点考虑历史成交价、数据血缘、模型贡献度等收益预期类指标,并通过公益性服务或第三方服务的方式解决市场信息不充分的问题。

第二,建立公共数据政府指导定价的基本框架。去年10月份起,我们配合国家发改委价格司起草相关文件,围绕公共数据有偿服务的政府指导定价可能会形成一些顶层政策。目前公共数据有偿服务并未进入政府收入目录,但不能收费意味着数据开放利用的可持续性不强,所以未来可能会制定专门的政府目录对定价进行指导。其基本原则是成本加成法,即在保证公益性的前提下,允许授权机构基于成本之上产生收益,确保为市场提供可持续的低价优质的公共数据资源服务。

未来公共数据定价可参考土地定价的发展轨迹。当前阶段应以成本补偿法为基本定价原则。一是在数据市场不活跃的情况下,基于成本法有助于快速确定公共数据公允价格;二是公共数据作为一种公共资产,基于成本法有助于推动大量优质低价的公共数据资源进入市场。从长远来看,在数据要素市场充分活跃和不妨碍社会主体创新积极性的前提下可以适时启动探索基于市场法和收益法的公共数据定价机制。

第三,报价-估价-议价社会数据价格形成路径。其核心环节是估价,由于买卖双方信息高度不对称,所以需要第三方机构提供估价服务,即从成本、数据质量、应用价值和品牌价值等方面多维度评估数据产品价值,为买卖双方提供议价合理性,降低议价成本。目前我们正在策划在深圳、上海、福建等地建设数据要素评估计价服务中心,就是为了解决这一问题。

深度分析数据要素市场建设现状、问题和建议,CMF专题报告发布

王晋斌:强美元、强黄金、强大宗

吕冰洋等:合作型政府:省以下财政体制视角

【视频】 邹静娴:再出发--2024中国宏观经济

张杰:构建中国优势“科技-产业-金融”循环体系:障碍、途径与改革突破口

黄石松等:发展银发经济要找准定位