文 | 中国政法大学、浙江省杭州市中级人民法院

叶胜男

北京理工大学 王磊

数字经济时代产生了以数据为代表的新型生产要素,成为企业业务营收增长,以及实现数字经济有序增长的加速剂,甚至成为企业参与市场竞争的核心要素。正是由于数据流通对释放数据要素价值、调整企业经营模式具有重要意义,实践中出现了以数据利用为目的的大量数据爬取与反爬取的情形。目前,理论界对商业数据的性质及权属等问题存在不同观点。因此,本文试针对商业数据的法律属性、数据爬取行为的判断因素、数据爬取行为各方利益平衡等问题进行讨论,以期进一步明晰数据爬取的相关问题。

商业数据法律属性探究

(一)商业数据的概念厘定

《中华人民共和国数据安全法》第三条规定:“本法所称数据,是指任何以电子或者其他方式对信息的记录。”因此,数据是一个包含商业数据、公共数据以及以数据形式表现出来的个人信息数据(集)的复杂客体。商业数据处于数字经济产业价值链的关键节点,受到了理论界和实务界的共同关注。尽管商业数据具有独立价值,但目前对此类数据尚未形成明确的共识,实践中常表述为“商业数据”“企业数据”。有别于公共数据的公共性特征,商业数据聚焦于数据的营利性使用,以发挥数据经济价值为核心目标,具有明显的商业色彩。因此,商业数据的定义可以总结概括为:数据控制者对其提供的产品或服务过程中收集、存储的类型多样、具有经济价值的大量原始数据,包括由此产生的衍生数据,通过加工、分析等方式处理后形成的具有经济价值的数据。

(二)商业数据的法律保护

数据分类分级保护是法律领域保护数据安全的基本前提,学界通过多种标准对数据分类提出诸多构想。有学者认为,在人工智能的应用中,可供利用的数据主要分为三类:一是个人所有的数据;二是私人企业和组织所有的数据;三是公共机构管理的数据。有学者从构建数据新型财产权角度出发,将个人信息和数据资产加以区分,并在此基础上进行财产权化的双阶段权利构建。另有学者认为,应当将数据区分为原始数据和衍生数据,其中,原始数据被称为“原生数据”或“基础数据”。由于衍生数据一般具有更高的社会经济价值,也被称为“增值数据”。以内容和公开程度为标准,有学者将商业数据进一步分为作品类商业数据、商业秘密类商业数据和公开商业数据等。对于前两类商业数据的保护,因数据具有特定形式可以受到类型化保护。例如,以汇编作品为代表的作品类商业数据受到《中华人民共和国著作权法》的保护。但是,公开商业数据的保护方式仍存在较大争议。近年来,商业数据纠纷涉及的数据多数是经营者公开的数据,甚至是以公开作为营利手段的数据,因此,明确对该类数据的法律保护路径确有必要。司法实践中主要以《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)作为对公开数据的保护依据。在数据权益的论证过程中,人民法院往往会注意以下几个方面:第一,数据获取的合法性;第二,相关数据承载行为主体的劳动,一定程度上是劳动的产物,体现投资与回报;第三,数据具有经济价值和交换价值,能够带来竞争优势,归属为一种竞争性权益。

数据爬取行为具体考量因素

数据爬取作为互联网企业在经营中采集公开信息常用的技术手段之一,常表现为互联网经营者使用爬虫软件对文本、图片、音频、视频等互联网信息的海量爬取。目前,从数据权益的存在、各方主体身份的认定、竞争关系的认定、不正当竞争等方面进行的判断,构成了数据爬取类不正当竞争纠纷的一般司法裁判过程。

(一)识别数据爬取行为当事人身份

数据爬取行为的经营者身份识别问题,涉及不同的认定标准,目前主要认定标准是基于“主体资格论”和“行为标准论”。前者认为经营者必须具备市场竞争关系和合法经营资格,后者认为只要有市场经营行为就可被视为经营者。《反不正当竞争法》第二条规定:“本法所称的经营者,是指从事商品生产、经营或者提供服务的自然人、法人和非法人组织。”因此,以获得营业资质限制经营者身份的标准不适用于新兴互联网业态,采用该标准可能不利于保护消费者权益。此外,以“营利性”作为对经营者行为的要求也存在争议。目前,有观点把数据置于生产要素的高度,将经营者作为取得该类生产要素的主体。互联网技术的更新迭代助推了数字经济业态的革新,网络经济活动已经成为一个具有明显特征的经济形态。在这种形态下,相较于传统经济活动,用户黏性和流量已经成为评估商品或服务竞争力的核心标准。因此,在反不正当竞争的法律评价体系构建中,不宜过分强调经营者的“直接营利性”,而应当更加注重用户体验和价值创造。

(二)判断数据爬取行为是否存在竞争关系

在数据爬取行为中,采取爬取行为的互联网经营者与被爬取的互联网经营者之间是否存在竞争关系,进一步引申出数据爬取行为是否构成该情况下不正当竞争的问题。对于这一问题的判断,笔者认为,应该进一步扩展竞争关系的认定范围,将市场主体之间竞争关系的认定由从事同种或类似商品经营业务、服务变为更广泛的竞争环境。现代经济中的竞争关系非常复杂,往往涉及多个行业和多种类型的企业。如果仅仅依靠行业来区分竞争关系,一定程度上会忽略许多其他因素对竞争关系的影响。此外,一些行业常处于动态发展过程中,竞争关系也难以明确。如果仍以传统的认定方式和经验进行考量,一定程度上会出现“裁判过重”的情况。有学者将经营者之间的竞争关系划分为直接竞争关系与间接竞争关系,其中,间接竞争关系是对竞争关系的扩大化理解。与一般竞争关系不同的是,这种竞争关系的认定不能仅局限于同一经营范围内,以及有无可替代性的考虑,而应更多地从行为的实质性出发,判断其是否符合客观的竞争标准。司法实践中,许多法院认定互联网行业中的竞争关系已经不再局限于同一产业和领域范围内,而是更加注重对互联网经营行为本质的评判。

数据爬取行为的保护性规范

在数据流通过程中,数据爬取占主导地位。因此,对数据爬取的相关行为进行规制,成为数据交易市场稳定的一个核心要素。数据爬取涉及数据持有者、数据爬取者及社会公众的权益。这三者之间利益关系较为复杂,使得在相关个案中数据爬取行为的法律性质存在多种情形。因此,有必要对数据爬取行为进行界定,规范法律适用的路径。

(一)一般条款的适用

实践中,以一般条款作为主要法律依据的做法存在丰富的适用经验,最具代表性的是2009年最高人民法院在“海带配额”案裁定书中的观点。该观点确立了一般条款适用的要件。一般条款的适用可分为形式要件和实质要件。形式要件是指某一行为属于《反不正当竞争法》规制的范围,但该法对该行为没有作出特别规定或者该行为不能落入该法规定的具体行为类型。一般条款在此情况下承担不正当竞争行为的兜底适用功能。实质要件则涉及行为正当性的分析判断,这涉及《反不正当竞争法》的核心问题。笔者认为,形式要件方面应恪守“避免向一般条款逃避”的原则。在《反不正当竞争法》增加互联网专条后,竞争行为如果能够纳入互联网专条评价之下,一般不适用一般条款。在这一原则指导下,不少数据爬取类案件适用了该法第十二条的规定。实质要件方面,多数案件基本上遵循“经营者损害+违反诚信原则和公认的商业道德”的不正当竞争行为判断标准,这也是最高人民法院在“海带配额”案中提出的观点。近年来,我国高度重视对涉数据不正当竞争纠纷的法律规制。2022年11月22日,国家市场监管总局发布《中华人民共和国反不正当竞争法(修订草案征求意见稿)》(以下简称《意见稿》)。值得注意的是,《意见稿》第十八条在延续《反不正当竞争法》第二条的基础上,将其扩展至数据领域,进一步明确了利用数据获取不正当竞争优势的范围,对涉商业数据不正当竞争行为进行了列举说明,厘清了数据爬取行为的法律边界。

(二)互联网专条的适用

《反不正当竞争法》第十二条第二款第(四)项的设置是为可能出现的新型不正当竞争行为提供的兜底性规定,便于司法机关在审理案件时有法可依。但不可否认的是,该条款具有一定的模糊性和主观性。例如,北京市高级人民法院发布的《关于涉及网络知识产权案件的审理指南》第34条提出,对于公认的商业道德的评价可以参照特定行业惯例、自律公约、信息网络行业的技术规范及其他参考因素。笔者认为,互联网行业内公认的商业理念和通行的交易习惯未必等同于法律意义上的正当行为,只有符合《反不正当竞争法》立法目的的行业惯例才能成为评价依据。例如,行业内允许在“爬虫协议”的权限内进行数据爬取,但“爬虫协议”作为一种行业惯例在法律上的效果和定性尚无定论。因此,是否可以将此作为判断数据爬取行为正当性普遍适用的法外规则仍有待商榷。

数据爬取行为的类型化判断

(一)违反相关协议的数据爬取

数据流通机制中,典型路径之一是多方以合同为基础,通过“开放应用端口”实现数据共享。这类数据爬取行为以“各方合意”为前提。当数据被爬取方与爬取方之间存在合法有效的数据转让或使用协议时,违反协议进行的数据爬取行为不仅侵犯了被爬取方的商业利益,还有违诚实信用原则。在商业经营中,商业道德作为经济平稳健康运行的客观要求,还对经济主体在诚信规范下行使权利与履行义务提出了预期要求。对于人们违反约定爬取等有关争议的解决,可以采用合同规则。

(二)损害消费者个人信息权益的数据爬取

2017年,全国人大常委会在修订《反不正当竞争法》时,增加了消费者合法权益这一内容,使得消费者权益成为《反不正当竞争法》的重要保护目标。消费者权益这一概念的引入,使得正当的竞争行为需要同时满足消费者利益、公共利益和经营者利益的平衡和协调,成为竞争行为正当性判断的依据。《反不正当竞争法》的修改,不仅明确了保障私人领域不受侵扰,以及人格权、财产权不得受到侵犯,还明确了维护消费者自主选择权益。消费者作为个人信息数据的提供主体,数据爬取方不能违背个人意愿开展针对其个人信息的爬取与利用,否则就损害了消费者自主决定的权益。因此,在进行数据爬取时,行为人需要注重对相关消费者个人信息权益的保护。对于严重损害消费者个人信息权益的数据爬取行为,法院可以判定为违背商业道德。

(三)超过合理限度的爬取

数据互联互通能够有效打破数据“孤岛”导致的数据流动和利用效率低下等现实困境,但应当明确的是,数据互联互通不是对数据无节制地获取利用,更不是帮助数据爬取者获取竞争优势的“挡箭牌”。因此,应当明确数据爬取行为的合理限度,对超越该限度的数据爬取行为予以法律规制。对于未经过数据获取和使用协议的数据利用行为,应当从爬取和利用的方式是否超出合理边界、该行为是否违反商业道德方面进行判断。因此,笔者认为,在市场竞争中,只有通过提高产品及服务质量或在合理范围内降低价格,以物美价廉的产品或服务进行竞争,才是合理和正当的竞争机制。脱离这一轨道的竞争行为应属于不正当竞争。

值得注意的是,《意见稿》中明确,不得违反约定或合理正当的数据爬取协议,获取和使用他人商业数据。关于利用数据所生产的产品或服务,能否为数据爬取方的原产品或服务带来“实质性替代”,应当全面综合考虑。

数据纠纷中的利益权衡

数据爬取行为作为促进数据互联互通的重要途径之一,在发挥数据流通价值的同时不可避免地对网络服务提供者带来负担。一方面,多线程的爬虫大量爬取某一特定网站会实质性占用该网站大量带宽资源,造成普通用户无法正常访问,对网络服务经营者造成技术负担;另一方面,针对特定网站的数据爬取具有减损该网站商业利益的可能性,即数据爬取行为可能导致被爬取网站在流量或数据等方面产生损失。因此,数据爬取中认定的数据竞争,应当从综合的视角进行判断。

2022年12月,中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》提出,市场在数据流通中起主导作用,要求“扩大数据要素市场化配置范围”,并指明了数据分配的方向,要求健全数据要素市场化配置机制,拓展数据要素市场化配置范围和按价值贡献参与分配。因此,对于判断数据爬取行为是否合法,应基于其所涉及的权益维护或受损情况进行评价。这种评价的根据是行为触及的具体权益情况。发生相关争端时,应注重各方主体利益的均衡,促使数据要素收益合理地偏向数据价值与使用价值的创造者,确保在开发数据价值各环节的投入有对应的收益。因此,为了划定数据爬取的违法边界,必须明确多重权益冲突中各方之间的平衡关系。实践中,数据爬取行为争议多出现于市场主体间。在许多不正当竞争的数据爬取案例中,争议的根源问题是数据保护和竞争权益之间的冲突。基于此,笔者认为,可以将涉及的冲突归纳为数据保护与竞争权益、数据开放与信息保护这两类。

本期封面及目录

<< 滑动查看下一张图片 >>

《中国审判》杂志2024年第8期

中国审判新闻半月刊·总第342期

编辑/徐畅