打开网易新闻 查看精彩图片

洪适权

广州知识产权法院院长

一级高级法官

【编者按】近日,广州知识产权法院院长、一级高级法官洪适权撰写的文章《数据赋权的纵向展开与区分登记制度》刊载于《中国应用法学》2026年第2期。本文系由广州知识产权法院和中国社会科学院法学研究所联合承担的最高人民法院2023年度司法研究重大课题“数据权益的知识产权司法保护问题研究”(课题编号:ZGFYZDK202317-01)的最新研究成果。现予转载,以飨读者。

本期特此编发北京航空航天大学法学院教授刘颖的《论案外人执行异议之诉与执行、再审、破产等程序的衔接—— <执行异议之诉解释> 第 6-9 条评析》 一文,供广大读者研究参考。

法院会议纪要类文件针对司法实践中的疑问及时作出回应和指导,具有较强的针对性和权威性,在指导审判实践、确保法律适用一致性和公正性等方面发挥着重要作用。在裁判适用时,应当从找准功能定位、规范适用标准、明晰适用程序、强化适用说理等方面进一步完善,形成更加规范化、可视化的纪要文件裁判适用路径,以有效发挥其及时更新裁判指导理念、统一司法裁判尺度、提升司法公信力等方面之独特作用。本期特编发周立法官《人民法院纪要类文件裁判适用的现状检视及路径构建》一文,供广大读者研究参考。

*因篇幅限制,注释等有删减,如需引用请参见期刊原文。

数据赋权的纵向展开与区分登记制度

文|洪适权

(本文刊载于《中国应用法学》2026年第2期,第179-191页)

内容摘要:当前,围绕数据登记的制度探索不断展开,但不同类型登记的权利基础、制度边界和登记效力仍存在争议。从数据处理的纵向流程出发,首先应回答原始数据能否成为权利客体。自然汇聚形成、具有特定范围和规模的数据集合,具有潜在的分析利用价值。基于其独立的可保护利益,经营主体因对该类数据的持续收集、维护和控制,可以享有新型数据财产权。数据在加工利用过程中还可能形成其他权利:以“算法+特定数据集合”方式加工形成的数据集合,因对后续开发利用具有实质性贡献,经审查可赋予数据知识产权并予以登记,其不同于“算法+技术特征”形成的专利权,也不同于算法本身;进一步分析衍生形成的数据,则可能构成作品等传统知识产权。由此,数据在纵向流程中形成“数据财产权—数据知识产权—传统知识产权”的权利流转体系,并可据此构建数据财产权与数据知识产权并存而有别的登记制度。

关键词:数据财产权 数据知识产权 数据的登记 权利流转

文 章 目 录

一、数据确权登记实践探索中相关问题的提出

二、数据赋权的纵向形态区分和初始形态赋权

(一)数据的纵向形态区分及初始赋权

(二)数据财产权的权利内容和范围

(三)数据产权结构性分置的权利化表达

三、数据财产权的纵向延续和权利性质转变

(一)纵向视角上的权利延续与转变逻辑

(二)算法存证的初加工数据可构成新的数据知识产权

四、数据财产权与数据知识产权区分登记和一体流通

结语

数据已成为第五大生产要素,如何促进流通、激发要素生产力,成为一个制度和理论上的革命性问题。随着 2022年12月《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)的发布,数据产权登记、数据知识产权登记及集中交易和基础设施建设先行。数据的登记同时具有数据赋权的制度探索目的,但在登记性质与效力、多途径登记的区别和必要性等方面存在争议。此外,数据赋权的必要性也受到质疑,认为依据现有法律制度足以解决数据纠纷,如通过商业秘密保护和反不正当竞争法的行为规制路径。鉴此,本文从数据处理的纵向流程视角探索数据赋权的可能路径和权利流转变化,以期为数据的登记实践提供理论依据、解读方案和完善建议。

一、数据确权登记实践探索中相关问题的提出

数据确权登记的制度先决问题,是数据赋权的法律体系空间和赋权可能方案。《中华人民共和国民法典》(以下简称《民法典》)第127条“法律对数据、网络虚拟财产的保护有规定的,依照其规定”宣示了数据的民事权益属性。民事财产权利包括物权、债权、知识产权、继承权、股权和其他投资性权利,以及“法律规定的其他民事权利和利益”。可见在现有权利体系下,数据赋权概括来讲有以下两种可能:其一是新型知识产权,即根据《民法典》第123条第2款的规定,有关数据民事利益可以作为一种新的知识产权进行赋权,特定形态的数据成为“法律规定的其他客体”。其二是依据《民法典》第126条赋予数据现有权利类型之外的新型权利,主要是区别于物权和知识产权的其他财产权。

当前数据确权登记探索主要围绕以下两种赋权可能展开。路径一:国家知识产权局开展的数据知识产权登记试点,从2022年11月开始至今已有两批17个试点省市。路径二:原由各地发改委联合经信、网信等部门推动,与各地大数据管理部门设立和数据交易所建设同步推进的数据产权或数据资产登记和交易实践,后由国家数据局主管。各地实践中有的将数据资产登记划归财政管理部门主管,形成数据产权、数据知识产权、数据资产三证。有的地方还开展了数据产品登记、数据资源公证、数据要素综合登记。呈现的法律基础问题,如依照类似的存证公证登记方法,何以数据知识产权登记产生一种新型知识产权,而数据产权登记则产生不同的排他性财产权?若经一定规则处理是数据知识产权登记的一个特点,那么一登“三证”这种方便市场主体的积极尝试,却使得数据产权和数据知识产权的权利边界更加模糊了。与登记确权目的形成差异的是,对数据进行登记客观上未能产生登记确权效力,司法实践亦认为这种存证登记只起一种数据来源合法的初步证明作用。同时,由于不存在程序和实质条件上的本质区别,两种类型的数据登记并无并存的法律制度意义。实际上,当前数据面临的最迫切现实问题是数字经济发展需求推动数据要素尽快流通和资产化利用,对数据进行登记亦更多考虑到方便交易和及时流通,尚未顾及论证法理基础和构建法律制度。

当前数据赋权的理论探讨亦主要围绕以下两种方案展开。其一是在知识产权框架下探讨数据权,如公开数据集合有限排他权和非公开数据集合的商业秘密保护相结合的方案,数据集合享有例外与限制的有限财产权,将数据产权置于知识产权体系之下并在司法实践中准确识别数据产品的智力含量,以及认为数据产品构成知识产权等。其二是在其他财产权框架下进行解释拓展以构建数据权,主要包括准物权说的用益权三权设置、新型财产权说的数据财产权、新型财产权说的数据专营权和数据资产权等。纵观之,数据知识产权赋权并未对数据知识产权登记给予理论支持;数据赋权讨论并未对各流程阶段数据形态的不同特点、权利变化及其衔接进行充分讨论;同时,亦未考虑数据知识产权和其他财产权两种不同的权利共存的可能方案。

鉴此,两种数据登记方案及其赋权理论依据有必要结合进行研究。

二、数据赋权的纵向形态区分和初始形态赋权

针对前述问题,首先要确定登记和赋权数据的形态及其在处理流程中的定位,分析流程视角数据利益归属和权利性质的延续或变化,探讨数据赋权的可能方案。

(一)数据的纵向形态区分及初始赋权

数据作为生产要素是一个经济概念,其内含形态非常广泛,讨论数据赋权却往往一概而论。然而,不同形态数据的价值利用方式并不相同。根据是否聚合,数据可以分为条目层数据和聚合层数据。其中,条目层数据在信息的表达和信息内容本身的价值层面判断是否受到传统知识产权制度的规制,故所谓数据赋权本质上是对聚合层数据的赋权。聚合层数据从流程视角可以分为原始数据、初加工数据及数据衍生产品。纵向流程不同阶段数据的权利具有延续性和变化性。处于不同流程阶段的数据本质上系同一数据在不同时间上的不同状态,后两者属于原始数据在使用流程上的纵向“分身”,不宜一开始就将指向同一信息内容的不同时间和状态的数据不加区分一起讨论。纵向流程上,数据利益的归属具有延续性,但其权利性质则可能发生变化,原始数据的权利归属和定性会对后续状态产生影响。故数据赋权首先应讨论流程视角中自然聚合形成的原始形态“大数据”的权利性质和制度构建,再讨论后续的初加工数据集合和数据衍生产品的权利问题。

互联网中自然聚合形成的原始形态的“大数据”,具有数据量大、类型繁多、内容实时变动、价值密度低等特点。“大数据”赋权的难题之一是由于实时变动,其作为客体的对象边界模糊,不像传统客体对象具有清晰的边界,但并非无章可循,其往往基于一定市场主体的经营行为而产生并自然汇聚形成。故市场主体的经营行为对数据的产生领域和范围、数据的聚合、数据作为资源存在和维护等,进行大体量高耗能的投入,并起到实际的控制作用和边界界定作用。因此在实时变动的无限“大数据”中,原始数据呈现为一个个有相对范围和控制主体的独立整体“特定量能数据”,其特定客体为包含特定范围信息的量能聚合数据,该范围与特定市场主体的经营行为相关,该市场经营主体为数据控制者。在民法的权利理论中,一般认为“权利系法律所保护的利益”。 根据权利的利益本质,特定量能数据发挥其汇聚所产生的增量价值,区别于内含条目数据的智力成果等信息表达层价值,具有独特的可保护利益。从客体的特性上分析,同为“无体物”,特定量能数据具有知识产权客体智力成果等的无体性、非独占性和共享性,但经营主体从经营投入上对数据的内容范围和聚合状态等具有实际的控制,故其还具有基于经营中的实际控制而产生的相对占有特性。概言之,原始数据可形成边界清晰和相对独立的特定量能数据客体,具有独特的可保护利益,可赋予其权利;又因其具有独特的相对占有特性,可据此构建不同于物权和知识产权的新型权利,即数据财产权。其权利本质的理论依据是基于因劳动投入而进行实际控制的相对占有所产生的利益。即数据财产权系一种非绝对占有的自然权利,具有自然获得性而区别于知识产权的行政授予性。

(二)数据财产权的权利内容和范围

对原始的特定量能数据所赋予的新型数据财产权,应具有与相对占有特性相匹配的权利内容,包括权利范围大小和权利的限制。

1.数据财产权的权能

数据财产权的权能是其权利的具体内容,也是权利构造的基本要素,可以比照物权和知识产权的权能予以论证。物权所有权具有占有、使用、收益、处分四项权能,知识产权一般认为具有禁止权能而无占有权能,此外还有使用、处分、收益权能。数据具有相对占有特性,有观点认为,数据权利的内容之一是“数据企业有权依据法律规定的方式对数据进行收集和存储”。本文认为,数据的相对占有或数据的控制,是指数据网络产品(或服务,下同)的经营主体,对特定量能数据在产生(数据条目产生、汇聚和动态持续存在)、利用(将该量能数据作为资源进行衍生分析及开展经营)、交易等环节可以进行实际控制,并以实际控制行为确定、宣示其特定的排他性。相对占有权能与数据的可权利客体的特性相符,即是在量能数据层面上的控制,因此控制的内容与量能数据的特定领域、产生、汇聚、动态存在、数据边界范围确定等方面相关,是对特定量能数据整体的相对控制。由于数据赋权法律制度的构建,需考虑数据控制权利与社会公众获取数据自由的关系问题,即注重激励数据投资而给予经营主体更大控制权,还是注重数据互联互通而给予公众更大获取自由。这是调研中市场主体反馈其最关心的核心利益问题,也是赋权的理论关键点。因此,体现占有相对性的相对占有权能,就成为数据权利制度构建中进行利益平衡的核心构造,是数据权利构造区别于其他权利的特性,也是数据财产权的基本权能,据此才有使用、处分和收益的权能。

2.相对占有权能的内容和权利范围

相对占有并非如物权的绝对垄断,而体现一定的利益平衡。一方面,数据财产权构建所体现的这种利益平衡的“政策性”,实际上是基于数据赋权的价值利益、权利客体的特性而产生,与数据的“自然”权利理论依据相一致。另一方面,数据财产权的相对占有权能不能与数据互联互通的属性相悖,需兼顾数据赋权激励和流通共享。通过对相对占有权能具体内容和大小的设定,确定数据权利的具体范围。

其一,相对占有权能是对特定量能数据实际上的占有或控制,并决定了权利的实现和保护方式。相比于知识产权的信息的表达客体和信息层价值,数据财产权的特定量能数据客体和汇聚性价值利益特点,决定了数据不能通过基于法定垄断的禁止权能起到权利的实现和保护作用,以类似于知识产权的“以公开换垄断”的法定垄断方案对数据进行赋权是无效的,必须通过对特定量能数据进行实际上的占有或控制来主张和维护权利。深究之,当市场主体就侵权行为主张权利时,知识产权制度基于确定的表达可以反推判断是否侵权;而数据保护的是其聚合中的量能投入带来的利益,其价值的利用和发挥在于分析聚合数据上的信息,即通过分析挖掘信息之间的关系和信息所链接的现实,而不在于聚合数据本身的具体信息之表达。因此,虽然仍是基于数据上的信息对数据进行分析利用,但量能数据能分析挖掘出其数据所含信息的表达本身所没有的增量信息,故较难甚至无法从数据利用结果去反推判断是否使用了相关数据。极限情况下,人工智能基于广泛的大数据语料进行训练后,具有了高度的泛化性能和不可预测性(涌现性)。基于特定量能数据进行分析挖掘虽然未达到这种泛化程度,但同样具有依据信息表达本身不能判断和预测的结果,无法从结果上来判断他人是否行使了自身权利。

其二,相对占有权能是对特定量能数据整体的占有或控制,具有占有的相对性而非绝对独占性。数据财产权的客体特性和保护利益特点,还体现在对作为数据权利客体的特定量能数据这一整体在产生、利用、交易中的占有或控制,而非对数据条目的控制和流通限制。数字经济发展要求数据互联互通和高效流动,数据赋权需在产权清晰、权利范围明确的基础上激励涉数据劳动和投资,而并非以排除他人获取数据条目为目标,二者应当具有内在的一致性。这种因经营行为而对可流通的数据条目聚合形成的特定量能数据这个整体进行“先占”和控制,区别于控制数据条目不被获取的商业秘密制度中的保密措施,或者控制数据条目不被进行信息网络传播的著作权制度中的技术措施。基于相关主体是产生数据网络产品的经营主体,其提供平台技术支撑和数据维护,且实际上可以控制数据的产生方式、是否产生、是否停止产生等,故可以认为甚至平台经营中最弱的技术措施可以宣示性地表明其是控制者,对数据进行了控制或相对占有,而不必等其关闭服务或将数据用绝对的技术手段封闭起来不被获取、无法流通才认可其实际上的控制。简言之,产生数据的网络产品经营者以一定的方式宣示其相对占有,则因其在先事实行为取得了数据财产权,而不要求其在技术上真正防止他人获取其中的数据条目。反之,如果经营主体完全没有设置占有意图的宣示性技术措施,则表示其放弃对该量能数据的相对占有权利,该量能数据进入公共领域不受保护。占有的相对性解决了数据流通与对数据劳动投资进行赋权激励的天然矛盾。

其三,整体相对占有决定的弱技术措施要求数据控制者需匹配强监测反制能力。由于数据的相对占有并不以绝对地防止他人获取数据条目作为手段,而是以防止他人获取特定量能数据整体作为目标和控制标准,故需对数据控制者的控制监测和反制能力提出相应要求。控制方式的宣示性避免限制数据流通,但并不意味着网络产品经营主体没有控制能力或可以没有控制能力。经营主体的弱技术措施可能出于经营需要等多种原因,其仍需对他人是否以获取特定量能数据为目的的连续获取数据条目行为具有监测和感知能力,否则可以认为其没有实际控制能力,不具有相对占有权能;或者因为其无法感知监测而放弃追诉他人侵权责任,也即放弃了权利。体现在制度设计上,包括独特的数据财产权的证明方式和举证责任,并承担事实上的占有风险。如将监测出他人持续爬取以获取量能数据为目的的行为,作为网络产品经营主体的举证责任。

其四,相对占有覆盖特定量能数据动态存在的整个周期,并达到控制数据动态存在的作用。由于特定量能数据是网络产品经营主体在经营中动态产生的大数据,没有固定的边界,数据的控制需覆盖其产生、利用和交易的整个动态存在周期。故相对占有权能包括利用和交易环节对数据的控制,与使用和处分权能并不重复或冲突。第一,数据产生中的控制,是市场主体经营劳动等投入对数据产生内容范围和聚合状态在决定、维护和改变方面的控制。需说明的是,关于物权的占有权能,制造物体可能形成对物所有权,但制造不属于所有权的内容;而数据的相对占有权能,则包括数据收集(汇聚数据条目并动态存续)等数据产生中的行为。第二,数据产生后作为数据资源存在和利用中的控制,可通过后台加密等技术进行强控制;设置登录后可见等受限访问方式予以适当控制;经营实际中某些数据往往需要在平台前端公开并通过与网络用户的互动而随时变化,这种情况通过反爬虫措施等技术手段进行一定的控制等等。第三,数据交易中的控制,如通过存证或存证登记以示占有或明确交易对象等。需指出的是,数据控制中会涉及数据的存储,但存储不是数据的占有或控制权能,只是一个控制的客观条件和表象,控制亦非依赖于存储。因此,区别于著作权制度,存储在数据财产权制度中不具有法律意义,在数据财产权制度中具有法律意义的是对聚合数据的动态存续控制。

综上,数据控制者权利范围的确定,即对特定量能数据整体相对控制具体内容的设定,这种“政策性”考量与其相对占有能力相符。同时,司法实践中擅自爬取公开数据是否侵害数据财产权,爬取多少数量数据和何种爬取行为构成侵权等问题,都能获得解决和理论支撑。

3. 与相对占有权能相匹配的数据权利限制

数据财产权作为一种非绝对占有的自然权利,虽然并非如知识产权客体不能独占而需进行政策性禁止并设定权利限制,但也并非如物权客体能进行物理上的独占而具有绝对排他的权利,仍因其占有的相对性而具有相应的权利限制。

首先,数据财产权的自然权利本质决定其无需设定期限。赋予数据基于实际控制的排他权,就具有了类似于物权实际上控制客体的自然垄断,无需再给予法定垄断设置垄断期限,而是与实际控制事实相匹配,由经营主体自行决定什么时候放弃对数据的控制使其进入公有领域。其次,数据财产权对量能数据这个整体的相对占有,仍受数据条目信息表达上权利的限制。就价值保护而言,虽然信息表达层面的价值不是聚合层数据客体所体现的价值,但包含信息的数据在聚合后,仍然受最基础的信息表达层面价值保护制度的限制。具体来说,其一,数据财产权受到数据条目知识产权的权利限制,即对聚合数据的使用不侵害数据条目信息的知识产权。其二,数据财产权受到数据条目来源主体利益保护的限制。数据的主体多元性体现在原始数据形成时的横向主体多元,以及来源主体与控制主体的可分离上。尽管数据量能汇聚性投入和控制主体归一,但多元主体对数据权利的形成及其使用、处分仍形成限制,要考虑信息来源者、数据控制者之间的利益分配。在数据来源者是个人的情况下,由于数据上的个人信息具有强保护性,财产性的权利利用须让位于个人信息承载的人格权和生命健康权,因此受数据来源者个人的权利限制。最后,数据财产权原始取得所依据的合法事实行为对权利形成限制。数据权利受限于网络平台经营法规政策和服务协议等。如对含有个人信息的企业数据财产权,其在收集数据获得权利及处分转让或授权他人使用时,遵循国际上基本公认的授权和双重授权原则,或者在收集数据获得权利时分别通过一般授权和特别授权等。可见,数据的这种占有介于物权和知识产权之间,三者占有情况的不同,根源在于客体性质和保护利益不同,结果在于排他强度和权利限制不同。

综上,数据作为一种新型财产权,其对原始数据的权利基础,源于数据控制者在合法经营过程中对数据的生成、汇聚、控制以及相应的实质性投入,包括依法支付对价等事实行为,形成原始取得的正当性基础。其权利主体多元,但在原始数据形成时,量能汇聚性投入和控制主体一般归一,数据控制者对其控制的数据享有数据财产权。以企业数据财产权为例,数据企业对合法收集的包括个人数据在内的全部数据享有支配的权利,性质上属于独立于人格权、物权、债权、知识产权的数据财产权。基于相对占有性,数据财产权这种因事实行为原始取得的财产权,可以理解为如物权占有取得这样一种自然取得的权利,而非如知识产权基于法律政策性授予的权利,非如因政府许可所得的权利,亦非派生于如个人对数据享有的权利等其他在先权利。

(三)数据产权结构性分置的权利化表达

基于数据财产权法律制度,可对数据产权结构性分置进行权利解读和法律语言的转化。

首先,数据(指原始数据或数据资源)持有者是与原始数据生产相关的主体,即数据生产者,欧盟立法中亦使用此概念,指实际上控制数据的主体。《数据二十条》中与此相关的是数据资源持有权。以企业数据财产权为例,数据持有者(数据生产者)就是企业数据财产权人,即数据控制者,而数据资源持有权就是企业数据财产权。

其次,数据来源者是与数据来源相关的主体。包括机器的所有者、信息输入者企业等,可以称为数据来源者企业;以及产生痕迹和内容的个人,可以称为数据来源者个人。《数据二十条》第7条要求充分保护数据来源者合法权益。从条文看,主要是指数据来源者个人,但从逻辑上看,还包括数据来源者企业,只不过数据来源者企业往往是数据生产者和数据持有者,其处于实际控制数据的主动地位,一般来说没有必要去强调保护。而从欧盟《数据法案》和欧盟数据设权立法的过程看,数据来源者企业与数据生产者(数据持有者)存在不重合而产生权利设定的问题,欧盟将数据来源者企业称为“数据用户”,欧盟《数据法案》为用户设定了访问权并相应地为数据持有者设定了接受访问的义务。因此,仍有必要区分数据来源者个人和数据来源者企业,且两者统称为数据来源者。数据来源者是企业数据财产权外部的一个主体,对数据财产权的形成具有前文所述的权利限制,但不属于数据财产权制度下的主体。

最后,讨论数据处理者、数据使用者和数据经营者。数据处理者是与《数据二十条》加工数据集合形成相关的主体,有采集、加工的数据处理流程贡献,以及有使用数据和获得收益的权利,与此相关的是数据加工使用权。数据处理者可以是数据持有者,也可以是数据持有者许可的他人。但数据加工使用权除了前述“加工”形成数据集合,还有“使用”这一方面,使用的主体即数据使用者。区别于加工形成数据集合,使用数据是对加工形成的数据集合的使用,或者是直接对原始数据的使用,使用结果往往是进行数据挖掘形成数据衍生产品。因此使用与加工不同,应予以区分。数据经营者是数据产品的经营主体,对应的是“保护经加工、分析等形成数据或数据衍生产品的经营权”,即数据产品经营权。这个“经营”是基于经加工、分析等形成数据或数据衍生产品后对数据产品的经营,可以是数据处理者自己,也可以是数据处理者许可的他人,仍有别于得到数据衍生产品后泛指的市场经营行为。概言之,对于企业数据财产权而言,数据处理者就是字面理解的实际数据处理主体;数据使用者就是使用加工形成的数据集合或者直接使用原始数据,进行数据挖掘形成衍生数据产品的主体;数据经营者就是实际经营数据产品的主体。三者均可以是企业数据财产权人,也可以是其他授权处理主体。由于基于事实行为自然取得的数据财产权具有延续性,自行处理的情况下形成的加工数据集合,以及使用自己加工的数据集合形成的数据衍生产品,也是企业所享有的数据财产权;而授权他人处理的情况下,则看其约定,这与其他权利的授权处理安排不存在差异,可以按照一般的规则处理。

综上所述,在数据财产权制度构建和法律语言之下,不存在具有独立法律规范意义的数据加工使用权和数据产品经营权。自行或授权加工、使用,是数据财产权处分和使用权能的体现;而自行或授权经营则是收益和处分权的体现。故数据处理、数据使用、数据产品经营并不形成单独的权利,而以原始数据资源的数据财产权确权为基础,按照一般财产权的安排和规则处理即可。即《数据二十条》的权利分置政策语言,可以通过数据财产权的法律制度语言予以解读。

三、数据财产权的纵向延续和权利性质转变

数据赋权起点的最基本问题解决后,进一步研究流程中数据可能构成的其他新型权利。

(一)纵向视角上的权利延续与转变逻辑

纵向流程视角上,具有数据财产权的原始数据经处理产生其他形态数据,涉及权利延续和权利性质的变化问题,分不同情况进行分析。

首先,数据财产权是对原始数据的聚合形态从流程视角进行数据赋权。由于企业数据财产权是一种因合法事实行为产生的新型财产权利,因此对于特定客体数据集合,在其自行处分的情况下,其享有的权利并不会因为形态的变化而丧失或减损,故对于初加工数据集合和挖掘开发的数据衍生产品, 自然延续原有的数据财产权,如初加工数据集合或挖掘开发的数据衍生产品尚不能构成作品。而如果初加工的数据集合或衍生数据产品这一分身,因符合其他权利的法律要件,如数据衍生产品构成作品,则归入现有知识产权的著作权范畴。而此时,著作权与数据财产权并不冲突,因为构成著作权的数据衍生产品,是以原数据为基础形成的流程视角上新的分身,原数据并不如物权一样材料经加工成产品而消耗转化,其数据财产权继续存在。而新形成的流程视角分身数据衍生产品,则另外形成一个著作权,在未处分的情况下,其权利的归属延续数据财产权的权属,即数据财产权人享有该数据衍生产品的著作权。亦即流程上的数据分身其法律性质发生了变化,不影响数据财产权利人即数据控制者,就该分身继续享有新的权利即著作权。同时,数据控制者对其“母体”原始数据集合仍享有数据财产权。

其次,流程中存在的其他形态数据,如当前登记实践中的初加工数据集合的权利性质问题。这类数据往往未形成知识产权,但由于添附了数据清洗、标注等重要工作和投入形成新的价值,显然已与原始数据不同。在相关的劳动添附未足以使其产生权利质变之前,仍属于数据财产权的范畴,劳动的添附也自然归一于该数据财产权。此类数据可以进行存证或进一步进行登记,并不改变其数据财产权性质。因此,作为自然权利的数据财产权,登记也并非其赋权要件。如果说“确权”是对权利的确认,那么登记倒可以视为一种对已自然形成数据财产权的形式“确权”行为 , 但允许证据推翻,其作用至多类似于著作权登记。当前实践中的数据产权、数据知识产权登记即是此类情形,其作用更多的是从主动确权的角度推动数据流通、促进生产力发展。

综上,数据财产权并非仅限于原始数据,还包括初加工的数据集合等,这种权利基于合法事实行为产生,非因数据产权登记等存证程序而获得赋权。

(二)算法存证的初加工数据可构成新的数据知识产权

流程中的数据还存在形成其他权利的可能,即数据赋权法律框架下的另一种方案——数据知识产权。数据知识产权概念和数据知识产权登记,为纵向视角上数据权利的转变提供了另一种思路。然而数据知识产权登记是当前数据登记中存有最大争议的部分,其登记程序未能体现和厘清数据知识产权的权利客体、权利的价值利益本质和政策性赋权机制等基础理论问题。

1.知识产权赋权的要求和数据知识产权登记的问题

知识产权法对现有作品、商标、专利等客体的认定或审查登记均基于法律明确规定的相应法律要件,如独创性、显著性、新颖性和创造性等,所以相应的认定或审查登记亦均在具备明确法律授权的基础之上展开。具体而言,著作权法框架下的作品登记并不具有直接赋权的法律效果,因为作品获得著作权采用“自动产生原则”,著作权登记仅仅起到作品著作权归属确认的初步证明作用, 允许证据推翻。相比之下,商标权和专利权都采用审查授权的模式,其中实用新型专利虽然未经实质审查程序,但匹配相应的无效程序,使得其形式审查和授权同样具有赋权效力。因此 , 只有经过行政审批程序确认符合法定要件,所申请的商标或专利才能实质上获得知识产权。

目前国家知识产权局总结的数据集合登记的客体应当符合“依法依规获取”“经过一定规则处理”“具有实用价值”三大要件,若其构成新型知识产权,需依靠“经过一定规则处理”要件。然而目前大部分地方试点都采用形式审查的方式开展登记工作。部分地方创新了登记审查的操作方式,先由第三方机构进行实质性审查,但审查的内容是数据的真实性、合法性,尚未提出“经过一定规则处理”要件的具体标准。而数据产权登记在其存证过程中,也往往经过一定的规则处理。如广东省数据产权与数据知识产权的登记存在合作互认的情况。结合杭州实行一登“三证”等做法,数据产权登记与数据知识产权登记并未体现出程序和实体上的区别。可见数据知识产权登记实践尚未能实现新型知识产权赋权的法律制度探索作用。

2.数据知识产权的赋权实质性要件构建

数据知识产权“经过一定规则处理”,往往是指经过一定的算法处理。这个实质性要件的设定需解决两个问题。一是使数据知识产权客体符合知识产权法律制度的权利客体和“权利之力保护”的价值利益特性,即审查登记形成特定的“信息的表达”客体,并体现智力成果属性的信息层面价值利益。二是使数据知识产权的登记与授权和数据产权的存证与登记存在区分。如果数据财产权经过登记存证后又进行数据知识产权授权和登记,那么需存在像前述数据财产权构成著作权一样的关系:两者同源,但不同的分身构成不同的权利,需有不同的权利客体。否则数据财产权与数据知识产权的登记在法律上实际归为一体,须正视并修正相关登记实践。

据此展开数据知识产权的构建探索,讨论数据知识产权符合知识产权属性的要件设定。首先,知识产权不是对信息本身进行立法,必须以一定合理的方式对信息上的价值进行确认和保护。由于“一定规则”或“算法”属于信息本身,故需另形成特定表达客体。其次,可借助类似的涉及算法的专利制度进行构建。人工智能相关发明专利是涉及人工智能算法或模型(以下统称算法)的知识产权,具有高度的类比性,其保护的信息价值是一种具有新颖性、创造性等要件的技术方案的价值,其客体是涉及算法的记载一种技术方案的“信息的表达”。

进一步分析,涉及人工智能算法的专利在审查中主要解决的问题包括:一是符合专利权客体的要求:其一,不属于智力活动的规则和方法。判断方法是“智力活动的规则和方法+技术特征”,即“如果一项权利要求对其限定的全部内容既包含智力活动的规则和方法的内容,又包含技术特征,该技术特征并非仅体现在主题名称中,则该权利要求就整体而言并不是一种智力活动的规则和方法”。解决方案是权利要求中写入“算法特征+关联技术特征(包括技术术语、硬件关联、应用场景,下同)”。其二,要符合“技术方案”的要求,即应当体现为解决技术问题采用遵循自然规律的技术手段并达到技术效果,具体包括:算法处理的是技术数据;算法与硬件相关联;利用算法进行场景挖掘。整体上也符合前述“智力活动的规则和方法 + 技术特征”的公式。二是算法特征带来创造性贡献:“如果权利要求中的算法应用于具体的技术领域,可以解决具体技术问题,那么可以认为该算法特征与技术特征功能上彼此相互支持、存在相互作用关系,该算法特征成为所采取的技术手段的组成部分,在进行创造性审查时,应当考虑所述的算法特征对技术方案作出的贡献。”解决方法是,“算法特征+关联技术特征”作为整体进行判断是否具有创造性。可见,涉及人工智能算法的专利审查与授权,主要通过权利要求中记载涉及算法的一种具有创造性等实质要件的技术方案的“表达”,即“算法特征+关联技术特征”的解决方案获得专利权。

相比专利权保护的是技术方案和技术贡献,数据知识产权虽然需要体现创造性贡献,但仍是在以特定量能数据为本源的数据财产权基础上,经过智慧加工的不同数据分身。因此,也应当体现出其特定量能数据的潜在分析经营价值得以通过更加智慧的方式进行利用的制度取向。涉及人工智能算法的专利权可以是“算法+应用场景”或“算法+技术数据”的技术方案,这里的应用场景和技术数据只是前述关联技术特征中的一部分,并未体现出特定技术数据或特定应用场景数据汇聚后的潜在分析衍生和经营价值。即特定技术数据或特定应用场景数据汇聚后的潜在分析衍生和经营价值在数据知识产权中的体现,是其与人工智能专利权的本质区别。

据此,可以类比构造“算法 + 特定量能数据”为信息的表达,以“为后续流程视角的数据利用提供了‘算法+特定量能数据’的实质性贡献”为权利的价值利益本质,以“算法+特定量能数据”整体体现的“对后续分析衍生和经营产生了实质性的贡献”为实质审查要件的解决方案。从客体的区别角度进行分析。首先,由于存在“特定量能数据”因素,数据知识产权不属于智力活动的规则和方法这方面,较专利更为显而易见,不构成一个问题。其次,相比专利的技术方案体现信息表达价值,数据知识产权的智慧成果价值应当在于为后续流程视角的数据利用提供了实质性的贡献,既包括算法部分,也包括特定量能数据部分。故以下三种情况可以构成数据知识产权。第一:算法(不同,创造性)+特定量能数据(不同);第二:算法(相同)+特定量能数据(不同,且不构成实质性替代);第三:算法(不同,创造性)+特定量能数据(相同)。以上不同,均是指与现有数据知识产权相比。

以上算法部分也可以扩展为“算法+技术特征”,即“(算法+技术特征)+特定量能数据”。因为“算法+技术特征”是可以符合数据知识产权要求的。如一项关于神经网络模型处理方法的权利要求,在其方案中明确记载了该方法用于对图像进行处理和分类,其中对图像数据的处理和分类属于技术特征。那么用该“算法 + 技术特征”对以图像为数据条目汇聚而成的特定量能数据进行“一定的规则处理”,是符合需求的。需要说明的是,算法部分包括“算法”以及“算法 + 技术特征”,还是仅指“算法+技术特征”,需要进一步研究。

根据以上三种规则授权的数据知识产权得到的原则性结果是,其对后续分析衍生和经营产生了实质性的贡献。其中算法部分的不同以创造性为标准,参考专利的创造性,包括方式、功能和效果,而如果算法部分是“算法+技术特征”,则可与专利的创造性相同。其中特定量能数据的不同,要求对象、范围(包括时间、空间)均不同;而“不构成实质性替代”则要求排除虽然不同,但明显用两个数据集合进行分析衍生经营,得到实质性相同的效果和作用,故两者可以进行实质性替代这种情况。这与专利仅判断算法加技术方案的整体创造性是存在本质区别的。因为当算法部分相同时,只要特定量能数据部分不构成实质性替代,也能对后续分析衍生和经营产生实质性的贡献,其贡献体现在特定量能数据部分上;而当特定量能数据部分相同时,算法部分不同,具有创造性,也能对后续分析衍生和经营产生实质性的贡献。

以上是数据知识产权客体、价值、审查要件的初步构建,需进一步形成审查授权制度。通过算法对一定范围内特定的有不停更新、持续供应能力的数据进行固定,其客体的表达是“算法(或算法 + 技术特征,下同)+ 特定量能数据”,构成数据知识产权专有权。其算法使得该客体呈现一定的形态,具有知识产权的智慧劳动贡献和价值,相比于同样对象的其他算法或同样算法的其他对象,具有特殊的潜在分析衍生和经营价值,与数据财产权予以区分。

3. 数据知识产权权能概述和制度价值简评

对数据知识产权进行审查授权,还应设定政策性的禁止权能,并以公开换保护。由于审查公开后的数据知识产权,其特定量能数据部分通常以存证方式进行固定,而非如专利和商标全文公开,其在知识产权的非独占性和共享性的体现上相对差一些。但这并非知识产权中的独例,软件著作权的登记就没有予以全文公开,故不影响其知识产权属性和禁止性权能的设定。至于其他具体的权能,知识产权内部各类权利也不一样,允许数据知识产权权能有其特点。

概言之,数据知识产权的赋权数据类型及应用场景主要是初加工数据集合。由于原始的数据资源不方便交易,《数据二十条》亦要求审慎交易数据资源,在形成数据衍生产品之前,经过清洗、标注初步加工的中间数据集合更加适合交易。且如数据标注已成为一项重要的数据处理工作,各类初步加工行为对数据的质量和达到的标准都产生了重要的影响。因此,对初加工数据集合根据其智力劳动和对后续数据处理流程提供的贡献,赋予新型的知识产权非常有必要。应该说,不仅初步加工数据集合可以形成数据知识产权,有些数据衍生产品也可以算法存证形式出现,构成数据知识产权。这也反映了某些情况下中间状态的加工数据集合和数据衍生产品界限并不分明,需依据交易的目的和加工的情况进行区分。而形成数据衍生产品后,往往构成著作权,具有直接的决策参考价值,并非对后续数据处理流程提供贡献,其交易的对象实质上发生了较大的价值变化。因此,这是两种目的的交易和经济行为。有鉴于此,有必要对经过清洗、标注等初步加工的中间数据集合进行赋权和交易。尤其是对于公共数据,交易时独特的算法存证有利于后续利用,不同市场主体可以通过自己的劳动贡献对相同的公共数据进行不同的算法处理,各自形成独特的价值和优势,对这种贡献和劳动进行政策性激励赋予数据知识产权,更能促进公共数据在不同市场主体间的公平、竞争利用,充分发挥公共数据的利用效能。因此,数据知识产权的权利增量是经特定算法处理的特定数据集合的这个增量,而不仅是数据本身,也非仅指算法贡献本身。

四、数据财产权与数据知识产权区分登记和一体流通

根据数据财产权和数据知识产权的法律制度构建,形成“数据财产权—数据知识产权—传统知识产权”清晰的数据权利流转体系。两种新型的数据赋权制度, 目前都存在登记实践。由于两种权利的性质不同,一种是自然权利,一种是依据法律赋予的权利,因此这两种数据的登记在实践中的效力和程序要求应当是不同的。以“算法 + 特定量能数据”整体体现的“对后续分析衍生和经营产生了实质性的贡献”为实质审查要件的数据知识产权审查登记方案,其算法使得该对象呈现一定的形态,对流程后续数据处理具有智慧价值贡献,匹配知识产权属性,其授权登记和登记证书具有权利赋权效力。而对于存证登记的数据财产权,则需对其存证方式的要求与数据知识产权进行区分。即在数据产权登记存证可以是对在先合法事实行为进行形式审查后,以通用的或数据的登记平台设定的流水线式存证方式,使大数据形态的特定量能数据得以固定或确定,方便登记和交易流通即可,而无需苛以数据知识产权的实质性审查要求。实践中一般是普通的哈希值存证,起到对数据财产权的信息载体数据进行公证存证的证据作用。

数据财产权的登记只起一个初步证明作用,并不意味着数据财产权登记没有意义。这种登记确定数据财产权的内容边界和对象范围以方便交易,否则散落的原始数据资源难以被主动地以“件”“个”论而整体进入流通,只能通过可能构成侵权的爬取行为来流通。从这个角度来说,确权交易比任意爬取更能激励和促进流通。因此这种登记不存在无效程序,但可以在审查登记程序中设置一定的公示和异议程序。虽然数据财产权不具有期限,但在进行登记时可设定一定的可续展期限,作为对登记数据的管理手段之一。而数据知识产权的登记,是对特定数据的算法表达的整体审查和授权登记,不仅仅是算法,也不仅仅是数据,亦即对同样的数据,其他人用不同的算法进行登记不构成侵权。故其效力强于数据产权登记,可以直接作为权利凭证,也应该允许一定程度的无效程序。同时,应当遵循知识产权的期限要求,设定一定的权利期限。此外,数据财产权中的公共数据财产权,基于其公共数据的公共利益属性,以及权利行使主体为直接持有或管理公共数据资源的党政机关和事业单位等因素考虑,单独进行公共数据资源登记和管理,与数据财产权理论和数据产权登记并不矛盾。

当然,如果数据产权登记的存证方式达到了数据知识产权的要求,理论上仍可予以登记,或者同时授权登记为数据知识产权和存证登记为数据财产权。从原理上看,流程视角的这一数据分身,当然延续其数据财产权法律身份,而当其同时构成数据知识产权的法律身份,不影响其原有法律身份。从这个角度看,理论上一次登记两个证书是可行的。但以数据知识产权的高要求进行数据产权登记,会导致数据产权登记本身的便利性等作用难以发挥,故没有必要。当前的问题恐怕是,数据知识产权登记未能名副其实,以及部分数据产权登记标准过高,导致未能明确设定两者的边界。

综上,数据产权登记是新型财产权的证明登记,数据知识产权登记是知识产权的审查授权,审查登记程序不同,但两者均是企业数据资产的一种,而数据资产则是一个经济概念和经济报表制度中的称呼。故应使用数据“产权”登记而不赞同使用数据“资产”登记。

最后,一体化数据要素登记或一次登记两个证书的做法,虽然理论上可行,但并不具有制度现实意义。更合理且务实的做法应当是基于流通系统寻求一体化的互认和流通交易制度。如使数据产权登记与交易系统相连通,或将数据知识产权登记吸收到数据产权交易系统。登记的数据财产权和审查授权登记的数据知识产权,虽构成要件和审查程序不同,但共同的大数据存证方式,使二者在流通利用上具有高度的交融性。数据知识产权也是财产权的一种,将其与新型的数据财产权在一个系统里交易流通,促进数据共通共享,这是完全可行的。

结语

在社会生产要素大变革时期,法律制度的基础制度作用在新的经济发展到一定态势后才有深厚的土壤得以构建完善并发挥。《数据二十条》已出台三年多,不同类型的数据登记实践已得到充分探索并暴露了其制度问题,亟须尽快构建数据财产权和数据知识产权的法律制度,尽量缩短制度空档期,为数据要素和数字经济的发展提供产权法律制度基础。本文相关探讨,为数据赋权和登记制度提供了一种衔接现有法律架构和数据登记实践的视角。

来源 | 中国应用法学

编辑 | 文亚欣

校对 | 罗冠明

审核 | 冼文光