建立数据挖掘例外法律制度
来源:中国社会科学报 更新时间:2024-11-19
  数据挖掘是生物医学、人工智能等产业发展的关键核心技术。数据挖掘的对象大多是受著作权保护的客体,数据挖掘面临一系列著作权侵权问题。对此,许多国家和地区进行了不同的制度探索,为数据挖掘规定例外条款,以消除系统性著作权侵权风险。

数据挖掘例外的重要价值

数据挖掘也称文本与数据挖掘,是通过分析数字形式的数据来获取新知识的自动分析技术,可极大提高研究效率,在大量文献中发现不同主题的潜在联系,从而开拓新的研究方向与领域。无论是早期的谷歌图书馆计划,还是近年来的互联网广告个性化推送,其底层技术均是数据挖掘技术。在人工智能的语境下,数据挖掘通常是训练机器学习的必需步骤,其应用场景更为丰富。

机器学习需要以数据为基础,训练数据的多寡直接决定输出成果质量。如果没有数据挖掘例外制度,将导致人工智能开发者只能使用法律风险较低的数据源来训练人工智能,即使这些数据明显存在偏见。因此,建立数据挖掘例外制度,不仅对人工智能产业具有促进作用,有助于解决其面临的系统性著作权侵权风险问题,还具有重要的“溢出效应”,有助于解决算法偏见或歧视问题。

数据挖掘例外的域外立法

域外国家和地区根据各自法律传统与产业发展实际对数据挖掘例外采用了不同的制度安排,主要表现为以下三种模式。

一是以日本法为代表的宽松型具体例外模式。《日本著作权法》在第30条之4第(ii)项中规定数据挖掘例外。该条款的适用范围非常宽泛,对数据挖掘例外的主体、可以豁免的侵权权利类型没有任何限制,允许数据挖掘例外用于商业目的,不要求数据来源必须是合法获得。究其原因,一方面日本希望为人工智能产业发展提供宽松的法律环境;另一方面《日本著作权法》将数据挖掘例外视为一种“非享受性使用”,认为非享受性使用并不会违反《伯尔尼公约》“三步检验法”中不得“不合理地损害作者的合法利益”的要求。“非享受性使用”与一些学者提出的“非作品性使用”“非表达性使用”概念存在相似之处。按照此类学者观点,非作品性使用并不是在著作权法意义下使用作品,此种行为本来就不应受著作权法规制,自然谈不上侵犯著作权。但在《日本著作权法》中,包括数据挖掘例外在内的3种“非享受性使用”例外规定在“著作权的限制”这一节,而构成著作权限制的前提是——某种行为属于著作专有权的涵盖范围。就此而言,《日本著作权法》数据挖掘例外条款的法理基础与非作品性使用概念的理论并不相同。

二是以欧盟法为代表的限制型具体例外模式。2019年,欧盟通过《数字单一市场版权指令》,第3条和第4条规定了文本与数据挖掘例外,分别是“以科学研究为目的的文本与数据挖掘例外”以及一般情形下的“文本与数据挖掘的例外或限制”。第3条将主体限定为研究机构与文化遗产机构,将目的限于科学研究,从而排除了为商业性目的进行文本与数据挖掘的适用。该条还将例外豁免的权利限制为复制权、提取权,而未包括改编权、向公众传播权等,适用范围较为有限,并不能完全解决相关法律障碍问题。第4条则没有限定受益主体的范围,表面上看似乎适用的空间很大,但是作者可以对例外提出保留,导致其效用大打折扣。《数字单一市场版权指令》之所以规定文本与数据挖掘例外条款,是因为欧盟委员会担心,文本与数据挖掘的合法性不明确可能会阻碍欧洲相关产业发展。然而,该指令的相关条款仍存在以下问题,导致其立法目的难以完全实现。这些问题包括:(1)例外的适用范围较为狭窄;(2)将合法获得数据来源作为前提条件;(3)客观适用范围的系统性不一致。

三是以美国法为代表的一般例外模式。不同于作者权体系国家明确列举具体例外类型的立法方式,美国版权法采用“因素主义”立法模式,只确定构成例外所需要考虑的因素,即所谓的合理使用多因素判断法。此方法最早由斯托里法官于1841年在Folsom诉Marsh案判决中采用,后来美国法院作了一系列判例,最终由国会在1976年版权法中进行法典化,在第107条确立了合理使用制度“四因素”。美国最高法院在1985年审理Harper & Row案时,曾将第四个因素“使用对版权作品之潜在市场或价值所产生的影响”称为“唯一最重要的因素”。后来,美国最高法院在1994年审理Campbell案,解释第一个因素“使用的目的与特性”时,引入了“转换性使用”概念。此后,美国法院经过长期司法实践,逐渐认可“转换性使用”在判断合理使用中的重要地位。

美国纽约南区法院早在2012年审理HathiTrust案时,即对数据挖掘的合法性问题作了详细分析,认为HathiTrust的索引属于一种转换性使用,与基础作品的表达性目的不同,构成合理使用。后来,美国第二巡回上诉法院在2015年审理谷歌案时,再次认可数据挖掘行为构成合理使用,并且指出谷歌的营利动机并不会压倒其极具说服力的转换性使用目的。因此,在美国法的语境下,即使实施数据挖掘行为的主体是商业性公司,具有商业性目的,只要符合转换性使用的认定标准,通常都可以被认定为合理使用。美国版权法规定一般例外标准而不规定具体例外规则的立法模式,具有较好适应技术创新与商业模式创新的优点,有不少国家予以借鉴,例如新加坡、菲律宾、以色列等。不过,也有一些国家在起草法律修正案过程中虽考虑过吸收借鉴,但因遭到强烈反对而未能成功,例如日本。反对的主要理由是,日本作为作者权体系国家的代表,不宜采用极具美式版权法特征的开放式、一般性例外条款。

数据挖掘例外的中国方案

我国《著作权法》自1990年颁布到2020年第三次修订之前,其著作权例外条款采用的都是封闭式列举模式,且只有12种例外类型,没有新增任何类型。从已有例外类型看,与数据挖掘行为存在一定关联度的是第1项“个人使用”例外与第6项“在课堂教学和科研中使用”例外。然而,前者不能适用于法人、非法人组织,后者对于复制行为豁免的规定较为严格,要求必须是“少量”复制,二者均不能适用于常见的数据挖掘应用场景。

2020年,《著作权法》新增了第13项:“法律、行政法规规定的其他情形”,但法院并不能将数据挖掘等情形直接解释为“其他情形”,只有法律、行政法规才能增设新的例外类型。这也就意味着2020年《著作权法》并未采纳类似美国版权法的开放式例外模式。在《著作权法实施条例》正准备修订的当下,我们认为,较为符合中国实际的立法模式应当是在《著作权法实施条例》中引入专门例外,“为了进行数据挖掘,复制、存储他人作品以及将数据挖掘成果向公众提供”。由于2020年《著作权法》纳入了“三步检验法”,因此实施数据挖掘行为还需要符合不得影响作品的正常使用,也不得不合理地损害著作权人的合法权益这两项限制性条件。前述例外规定采取的是结果导向型,而非欧盟那种条件限制型立法模式,能够兼顾产业发展与著作权保护,更具合理性。

(作者系中国人民大学法学院教授)