郑友德 | 汤森路透诉Ross 案及其简评,AI:为“合理使用而生”!

文 | 郑友德

华中科技大学知识产权与竞争法中心

目次

一、案情

二、裁判

三、Thomson Reuters在合理使用抗辩中的胜诉因素

四、裁判要点

五、简评

2025年2月11日,在美国备受关注的AI相关版权诉讼中的合理使用问题上,美国第三巡回法院法官Stephanos Bibas(被指定为特拉华州地区法院法官)作出了首例裁决[1]。裁决认定,美国版权法不允许Thomson Reuters现已倒闭的前竞争对手Ross Intelligence复制Thomson Reuters的内容来构建一个竞争性的人工智能平台,Ross擅自使用Thomson Reuters受版权保护的材料训练AI不属于版权上的合理使用

颇具讽刺意义的是,此前曾暗示Ross的AI训练可能符合合理使用的同案主审法官Bibas,现在却认为这甚至无需讨论,明显不属于合理使用。尽管该裁决明确限于其独特事实,但它可能对针对AI模型的未决侵权案件产生重大影响,并有助于界定AI模型训练中使用受版权保护材料的可接受边界。

一、案情

Thomson Reuters拥有其Westlaw摘要和关键编号系统的版权——这些编辑内容用于组织司法意见并帮助研究人员导航法律。Ross是一个由AI驱动的法律研究平台,其使用这些摘要来训练其产品的AI模型。Thomson Reuters起诉Ross侵犯版权。Ross提出了多项抗辩,其中最重要的是合理使用。双方都提出了简易判决动议。主审法官Bibas最初拒绝了关于合理使用和其他关键问题的简易判决[2],并将案件准备进入审判阶段。然而,在一个令人震惊的进展中,Bibas法官按下了暂停键,表示他正在重新考虑先前的裁决,实际上将简易判决重新提上日程。2025年2月11日,法院发布了以下裁决。

二、裁判

(一)Ross复制了Westlaw的摘要

法院首先确定了Westlaw的摘要和关键编号系统因涉及原创的编辑选择而具有版权性。随后,法院认定Ross复制了这些材料,指出Ross用于训练其AI的“批量备忘录”看起来“更像摘要而非基础司法意见”,这是“实际复制的强有力间接证据”。法院不需要专家来认定数千条摘要与输入平台的训练材料实质相似:“作为一名律师和法官,我自己就是Westlaw摘要的普通用户,因此我有能力在此确定实质相似性!” 法官Bibas强调。

(二)Ross的非合理使用抗辩站不住脚

法院轻松驳回了Ross基于无辜侵权、版权滥用、思想表达合并原则(The merger doctrine of idea and expression)和必要场景原则(scenes à faire doctrine )提出的抗辩,认为这些抗辩“都站不住脚”。

三、Thomson Reuters在合理使用抗辩中的胜诉因素

法院意见的核心是其合理使用分析。与早先认为Ross的AI训练可能符合合理使用的立场截然不同,法院发现Thomson Reuters在以下两个决定性因素上胜诉,并在整体平衡中占据优势。

(一) Ross开发了商业竞争产品不符合合理使用

法院迅速指出Ross的目的是商业性的(Ross开发了一个营利性法律研究服务),随后分析了Ross复制Westlaw摘要是否具有转化性。法院参考了Andy Warhol Foundation for the Visual Arts, Inc.诉Goldsmith案(2021)[3]。在这一具有里程碑意义的合理使用案件中,美国最高法院裁定,如果原作和二次使用具有相同或非常相似的目的,且二次使用具有商业性质,那么第一个因素通常会不符合合理使用——除非使用者能提出另一个强有力的复制理由。应用这一标准,法院认定Ross的使用不具有转化性,因为它“使用Thomson Reuters的摘要作为AI数据来创建一个与Westlaw竞争的法律研究工具”。

法院随后转审Ross的又一抗辩论点,即摘要从未向最终用户展示,而是被转换为“数值数据”在后台使用。法院驳回了这一所谓的“中间复制”抗辩,区分了早期的先例,如在Sega、Sony和Google诉Oracle案[4]中,中间复制被认定为合理使用。法院认为,上达案件涉及计算机代码,其本质上是功能性的,并且为了实现互操作性而必须复制。而在本案中,Westlaw的摘要是编辑性(非功能性)的,不需要复制以实现Ross的新目的。

(二) Westlaw的摘要几无原创性符合合理使用

尽管法院承认Westlaw的摘要达到了可版权的低门槛,但它指出这些摘要主要是对事实材料的总结,原创性表达极少。因此,法院得出结论,摘要“远非最具原创性的作品”,鉴于其主要为事实性质。因此,因素二对Ross有利,尽管法院指出这一因素“在合理使用争议的裁决中很少起到重要作用”。

(三) Ross的摘要未向用户展示符合合理使用

尽管Ross据称复制了数千条摘要,但法院关注的是这些摘要未在Ross的最终输出中使用,得出结论:“重要的是……由此向公众展示的数量和实质性。”因此,第三个因素有利于合理使用。

(四) Ross的产品威胁到Westlaw的商业模式和数据许可机会不符合合理使用

因素四被法院称为“合理使用中最重要的单一因素”,它考察了Ross复制可能对市场产生的影响,包括现有和潜在的衍生市场。尽管法院最初将这一问题留给陪审团——担心Thomson Reuters是否打算将其摘要许可用于AI训练以及Ross是否真正与Westlaw竞争——但现在它确信Ross的产品对Westlaw市场及未来AI训练数据许可机会构成了直接威胁。

法院还权衡了Ross工具可能带来的任何公共利益与重大市场损害。它发现,公众免费获取司法意见的能力足以满足公众获取法律的需求。然而,法官的以下观点将受到版权界的欢迎:

“公众无权获得Thomson Reuters对法律的解析。版权鼓励人们开发有助于社会的事物,例如优秀的法律研究工具。它们的开发者有权获得相应的报酬。”

四、裁判要点

(一) 虽然美国大量AI案件中有对原告有利的在先判例,但事实有别于本案

在未决的AI+版权案件中的原告肯定会将本裁决作为支持其对AI开发者索赔的有力依据。然而,法院强调,它是基于Ross的特定用途——即使用受保护的材料构建直接竞争的法律研究工具——而做出不利于合理使用的裁决。法官Bibas称,“由于AI领域正在迅速发展,我提醒读者,今天我面前只有非生成性AI。”因此,该裁决为大型语言和生成性AI模型的开发者提供了充分的空间,以便在事实上与其他有关案件相区分。

(二) 本判决严重依赖Andy Warhol Foundation for the Visual Arts, Inc.诉Goldsmith案(2021)

该裁决严重依赖最高法院的Warhol框架,该框架强调二次使用是否与原始作品“具有相同或非常相似的目的,是否实际损害原作的商业利益。”法院认定Ross的竞争性使用不具有转化性,这引发了广泛担忧,即Warhol案可能会缩小合理使用的范围。希望主张转化性使用的AI开发者认真研究Warhol案,寻求在其产品与版权持有人的产品直接竞争时可能构成侵权的预防对策。

(三) 对AI工具开发者的重要指导

法院为使用受版权保护材料训练AI的开发者划定了界限:如果你的模型有效地利用了他人的编辑劳动来创建竞争产品(即使底层文本未向用户展示),则可能不符合合理使用。合理使用分析可能会因AI模型训练方法、用途、目的和最终产品的不同而有所不同。

(四) 输出中未出现大量复制并非决定性因素

该裁决挑战了合理使用仅取决于最终产品是否引用原始材料的观念。尽管合理使用可能包括对大型数据集的中间复制以使其可搜索,但它可能不支持为开发竞争性商业产品而进行的中间复制,即使这些作品本身从未公开。

尽管该裁决似乎是AI内容所有者在对抗人工智能浪潮中的一次重大胜利,但地区法院将许多疑难问题留待上级法院解决,比如,Ross是否侵犯了West关键编号系统及其他数千份摘要。因此,一审被告很可能向第三巡回法院上诉,最终可能会得出不同或更广泛的合理使用观点。

五、简评

(一)AI“为合理使用而生”

AI技术的核心在于通过大量数据训练模型,从而生成新的内容或提供新的功能。这一过程天然涉及对现有数据(包括受版权保护的材料)的使用。合理使用原则的初衷是为了促进创新和知识传播,允许在特定情况下未经许可使用受版权保护的材料。AI技术的目标——通过学习数据创造新价值——与合理使用的精神高度契合。合理使用的一个重要标准是“转化性”,即二次使用是否赋予了原始材料新的目的或价值。AI模型通过对数据的分析和学习,生成全新的输出(如文本、图像、代码等),这种转化性使用正是合理使用原则所鼓励的。例如,AI模型可以将法律摘要转化为可搜索的数据库,或将艺术作品转化为新的创作风格,这些都可能被视为具有转化性。AI技术的快速发展正在推动合理使用原则的边界扩展。例如,在Google Books案Authors Guild诉Google案中,法院认定对书籍的大规模数字化和索引化属于合理使用,因为这些行为具有转化性并服务于公共利益。AI技术的广泛应用可能进一步推动合理使用原则的适用,特别是在非商业性、研究性或教育性用途中。

(二)AI“为合理使用而死”

Thomson Reuters诉Ross Intelligence案中,法院认定Ross使用Westlaw摘要训练AI模型的行为不属于合理使用,主要是因为Ross开发了一个与Westlaw直接竞争的商业产品。这一裁决表明,合理使用原则在商业竞争场景中的适用可能受到严格限制。如果AI技术的使用目的是为了开发竞争性产品,即使其具有转化性,也可能被认定为侵权。这一标准可能缩小版权合理使用的范围,特别是在涉及商业用途时。对于AI开发者而言,这意味着他们需要更加谨慎地评估其技术的使用目的,避免与原始材料的商业用途产生直接竞争。如果合理使用原则在AI领域的适用受到更多限制,开发者可能需要通过合法授权获取训练数据,这将增加AI开发的成本和复杂性。对于资源有限的AI初创企业或研究机构而言,这可能构成重大障碍,甚至导致某些AI项目无法继续进行。

(三)AI与版权合理使用的未来

AI技术的快速发展要求对合理使用原则进行重新审视和定义。例如,是否可以为非商业性或研究用途的AI训练提供更多豁免?是否可以根据AI模型的转化性程度来评估其合法性?未来可能需要更精细的法律规则来平衡版权保护与技术创新。随着合理使用原则的收紧,数据许可市场可能会迅速发展。版权持有人可以通过授权AI开发者使用其数据获得收益,而开发者则可以通过合法途径获取高质量的训练数据。同时,数据共享机制(如开源数据集、数据合作社)也可能成为解决数据获取问题的重要途径。

(四)总结

上案中的裁决,不仅对AI开发者使用受版权保护材料的合法性提出了明确限制,还引发了对AI技术发展、版权保护、商业模式和法律框架的深层次思考。这一裁决的影响远超出个案本身,触及技术、法律、经济和社会的多个层面,其借鉴意义与现实意义可以从以下几个方面进行归纳。

首先,裁决对AI技术的发展产生了深远影响。AI技术的进步依赖于海量数据的训练,而这些数据往往涉及受版权保护的内容。裁决表明,未经许可使用受版权保护的材料可能构成侵权,这直接限制了AI开发者获取数据的途径,可能对AI技术的创新产生“寒蝉效应”。开发者可能会因为法律风险而回避使用高质量但受版权保护的数据,转而依赖低质量或开源数据,从而影响AI模型的性能和可靠性。此外,裁决还引发了对技术中立性与法律责任之间冲突的思考。即使AI模型的输出未直接展示受版权保护的内容,其训练过程中的数据使用也可能构成侵权,这要求技术开发者在追求创新的同时,更加注重法律合规性。

其次,该裁决对版权保护的适用范围和边界提出了新的挑战。裁决确认了编辑性内容(如Westlaw摘要)的版权性,即使其创造性较低,这表明版权保护的适用范围正在扩大。然而,这种扩张也可能引发争议:如果连事实性材料的整理和总结都受到版权保护,是否会过度限制知识的传播和再利用?未来可能需要更精细的规则来平衡版权保护与公共利益。同时,裁决强调了版权持有人对其数据的独占使用权,包括将其用于AI训练的商业机会,这可能催生数据许可市场,但也可能导致知识垄断。如何防止知识垄断,同时鼓励数据共享,是一个亟待解决的问题。

第三,裁决对商业模式产生了重要影响。随着AI训练数据的合法性受到更多关注,数据许可市场可能会迅速发展。版权持有人可以通过授权AI开发者使用其数据获得收益,而开发者则可以通过合法途径获取高质量的训练数据。然而,裁决也可能加剧AI行业内的竞争壁垒,拥有大量合法数据资源的企业将在AI开发中占据优势,而AI初创企业可能因数据获取成本高昂而处于不利地位。为了避免侵权风险,AI开发者可能需要更加注重产品的差异化设计,确保其AI模型的使用目的和输出结果与原始材料有显著不同。

第四,裁决对法律框架的完善提出了新的要求。合理使用原则在AI领域的适用需要结合具体事实进行判断,特别是在涉及商业竞争和转化性使用的场景中,这可能推动立法机构对合理使用原则进行补充或完善,以更好地适应AI技术的发展。同时,AI技术的全球性使得版权问题更加复杂,不同国家对合理使用的定义和适用标准可能存在差异,这可能引发跨国法律纠纷。未来可能需要国际组织制定全球性的合理使用框架,以协调各国的法律实践,减少跨国法律冲突。

最后,裁决对公共利益的影响也不容忽视。法院在裁决中强调,公众有权免费获取司法意见,但无权免费获取Thomson Reuters对法律的解析。这表明,版权保护在鼓励创新的同时,也需要平衡公共利益。这一观点可能引发关于知识获取与版权保护之间关系的广泛讨论,特别是在教育、科研等非商业领域。此外,如果AI训练数据的获取成本过高,可能会限制AI技术的普及,特别是在资源有限的发展中国家或AI初创企业中。这可能促使WIPO等国际组织制定全球性的数据共享框架,以促进AI技术的公平发展。

总之,Thomson Reuters诉Ross Intelligence案的裁决不仅明确了AI训练数据的合法使用边界,还推动了版权保护、商业模式和法律框架的演变。然而,这一裁决也引发了许多未解的问题,例如如何在全球范围内协调版权法、如何平衡创新与公共利益、以及如何确保AI技术的公平性与普惠性的兼顾与平衡。这些都是亟需持续探索和解决的问题。

注释(上下滑动阅览)

【1】1739288038966.pdf 2025年2月13日最后访问

【2】2023年,Bibas法官驳回了Thomson Reuters关于版权侵权的初步简易判决动议,并且没有拒绝Ross的合理使用抗辩。该裁决在很大程度上基于Bibas法官的观点,即合理使用抗辩的第四个因素(涉及市场影响问题)的分析应留给陪审团决定。Bibas法官当时认为,“Ross的使用可能是具有转化性的,它创建了一个全新的搜索平台,服务于与Westlaw不同的目的。”他推断,如果属实,“那么Ross将不会成为Westlaw的市场替代品。”。Bibas法官还提到了一些担忧,例如“是否存在相关且真实的实质性事实问题,即Thomson Reuters是否会使用其数据来训练AI工具,或将其摘要作为训练数据出售。” The First U.S. AI Copyright “Fair Use” Ruling Favors Copyright Owners | Fox Rothschild LLP - JDSupra 2025年2月13日最后访问

【3】ANDY WARHOL FOUNDATION FOR VISUAL ARTS INC v. GOLDSMITH (2021) | FindLaw 2025年2月13日最后访问

【4】141 S. Ct. 1183 (2021). 135-Harv.-L.-Rev.-431.pdf 2025年2月13日最后访问

作者:郑友德

编辑:Sharon


分享到微博
分享到微信
    分享到领英

相关文章