郑友德 | 德国GEMA诉OpenAI案判决试读


作者 | 郑友德
华中科技大学知识产权与竞争法中心教授
目次
导言:数字时代版权保护的关键判决
一、原告GEMA的最终诉讼请求
二、判决要旨
三、与国外近期裁决的比较
四、被告上诉的可能性及理由
五、该判决的现实与理论意义
· 余论
慕尼黑地区法院
导言:数字时代版权保护的关键判决
数字化浪潮,特别是AI技术的飞速发展,正以前所未有的方式重塑创作生态,也对传统版权法体系提出了深刻挑战。在这一背景下,本案作为德国乃至全球范围内,首例对大型语言模型训练及运营过程中所涉著作权问题作出全面、深入裁决的司法判例,备受瞩目。
2025年11月11日,慕尼黑第一地方法院第42民事庭(版权案件专门法庭)就“GEMA诉OpenAI”一案(案号 42 O 14139/24)作出一审判决。裁决绝大部分支持了原告GEMA[1]的诉讼请求,仅驳回了其中基于人格权的部分。其核心在于,法院认定OpenAI在ChatGPT模型的训练和输出中,未经授权使用了九位知名德国作者的歌词作品(包括《Atemlos》和《In der Weihnachtsbäckerei》等),侵犯了复制权和向公众传播权。
此判决首次在司法层面系统回应了AI与版权冲突的核心问题,全面强化了创作者在面对AI提供商时的法律地位。法院不仅责令OpenAI停止侵权行为,更确认其需为使用受版权保护的歌词承担赔偿责任。
尽管本案判决尚未终审生效,且OpenAI尚未明确表示将提起上诉,但裁决所确立的“记忆即复制”等裁判表述,已对AI产业发出明确信号:技术创新不能以牺牲创作者合法权益为代价。这一里程碑式的判决,不仅关乎个案正义,更将为全球范围内AI大模型训练过程中大规模使用作品的版权治理提供了关键法理依据。
一、原告GEMA的最终诉讼请求
法院在判决主文(Tenor)中支持了GEMA的核心诉求,具体如下:
1. 第1a项 禁止令(模型训练中的复制):禁止被告(OpenAI的爱尔兰和美国实体)在未经原告同意的情况下,在“ChatGPT 4和4o”等语言模型中,全部或部分复制附件K1(本案中九首涉案歌词的明确清单—本文作者注)所列的歌词,或委托第三方进行此类复制。
2.第1b项 禁止令(输出中的侵权):禁止被告在未经原告同意的情况下,在生成式聊天助手的文本输出中,将附件K1所列歌词全部或部分、或以改编形式进行公开传播、复制,或委托第三方进行此类行为,具体行为如附件K2(是原告GEMA提交给法院的一套证据文件,里面包含了多张聊天记录的截图——本文作者注)所示(指的是:被告AI实施侵权的具体方式,就是像在证据集K2的聊天截图里所记录的那样:当用户进行简单提问时,AI会输出那些被记忆在模型里的歌词,而且这些输出构成了对原歌词的改编,从而侵犯了原告的复制权、公开传播权和改编权。—— 本文作者注)
3.第2项 信息披露:判令被告向原告提交一份有序的清单,披露自特定日期(被告1:2023年12月14日;被告2:2022年11月30日)以来,实施第1项所述行为的范围(包括行为的数量和规模)以及由此获得的收入(营业额)。
4.第3项 损害赔偿确定:确认被告有义务赔偿原告因第1项所述行为已经发生和/或将来发生的所有损失。
5.第4项 判决公布授权:授权原告在判决生效后6周内,在《南德意志报》周末版经济板块第3版,以1/4版横版格式,以被告承担费用的方式公布判决的裁定部分。
6.第5项 律师费支付:判令被告向原告支付庭外律师费4,620.70欧元,并自2025年2月26日起支付高于基准利率5个百分点的利息。
7.第1c项 驳回:法院驳回了原告基于人格权(错误归属)的禁止令请求(即禁止被告声称或散布附件K2中的文本是由附件K1中的作词者所创作)。
二、判决要旨
法院的判决书以严密的逻辑逐步驳回了被告OpenAI的全部核心抗辩,并构建了一套适用于AI生成内容技术的著作权侵权判定规则。
(一)程序与资格问题:为实体审理扫清障碍
法院首先确认了诉讼在程序上的正当性。针对被告关于诉讼请求不明确的抗辩,尤其是其中使用“部分”、“改编形式”等词汇的问题,法院援引判例确立了“结合诉状可明确即可”的标准,认为原告的请求已通过参照附件K2所载的具体侵权行为而达到“尽可能明确”的程度,完全符合《德国民事诉讼法》第253条的要求,足以界定禁令范围并为被告提供充分的辩护基础。
在原告诉讼资格方面,法院确认GEMA通过与作词者签订的特别授权协议,不仅取得了针对AI系统侵权内容的专有使用权,还获得了明确的诉讼代理授权,具备以自己的名义主张权利的完整资格。法院同时驳回了被告关于授权协议因条款模糊而无效的主张,指出这些专门为本诉讼订立的协议在授权范围上足够具体清晰,特别是明确指向“KI-Systeme”(AI 系统)的侵权行为。对于人格权主张这一特殊领域,法院在承认人格权高度人身属性的前提下,开创性地认定当诉讼代理人拥有值得保护的经济利益,且权利人已就AI侵权这一特定侵权类型作出明确具体授权时,此类诉讼代理应当被允许。此外,法院还确认作词者已将相关损害赔偿请求权转让给GEMA,进一步巩固了其诉讼地位。
(二)模型训练阶段:认定“复制”并暂闭“豁免”之门
在判决最具突破性的模型训练定性部分,法院系统性地确立了“记忆即复制”的法律原则。法院指出,“记忆” 在信息技术研究中是公认的:大型语言模型在训练过程中不仅仅是提取训练数据中的信息;它们也可能在训练后的参数(比如权重和偏置)中固化训练数据,用户通过简单提示词即可触发所诉歌词信息输出,充分证明了作品在模型中是实质性存在的。在法律概念延伸层面,法院将“复制”的范畴从传统的人类可读载体拓展至机器可读的模型参数,明确驳斥了“参数中无具体数据集”的技术性抗辩,强调法律关注的核心在于功能结果——即作品能否被再现。法院特别援引欧盟法院判例,重申复制权技术中立原则,指出其宽泛定义本就旨在包容各种新兴技术形态。
对于文本与数据挖掘(以下简称TDM)豁免的适用问题,法院通过创新的“阶段论”分析方法,将训练过程区分为不同阶段,并明确《德国著作权法》第44b条规定的TDM豁免仅适用于为数据分析做准备的临时性复制环节,如数据抓取与格式化等前期工作。而对于训练完成后永久留存于模型中的“记忆化”复制,法院判定其性质已发生根本转变——目的不再是为分析,而是构成对作品的新的独立利用形式,这种对权利人核心开发利用利益的持续侵害,绝不能为TDM豁免所覆盖。
在过错与责任认定方面,法院基于自2021年起就已公开的学术研究证据,认定被告至少存在过失,因其在明确知晓模型存在记忆化风险的情况下,未能采取有效措施避免对特定作品的侵权。对于被告提出的比例原则抗辩,法院则强调著作权法的核心使命在于保护权利人,且被告在收到警告函后已拥有超过一年的时间寻求许可或重新训练模型,因此无需给予任何“缓冲期”,坚决驳回了关于禁令将导致退出德国市场的不成比例主张。
(三)模型输出阶段:确立运营者的直接侵权责任
在模型输出行为的法律定性上,法院构建了完整的责任认定体系。
针对是否公开传播权(《德国著作权法》第19a条)的侵害,法院明确认定被告作为运营者才是法律意义上的行为主体——正是通过其提供的服务,公众得以在任何地点和时间获取被记忆的歌词内容。法院强调,当输出结果直接源于模型内部记忆化机制,而非用户复杂诱导所致时,侵权责任必须归于对系统拥有完全控制力的运营者。同时,法院确认聊天助手的用户群体构成著作权法意义上的“新的公众”,即使相关作品已在网络其他平台存在。
针对输出内容的法律性质,法院通过对“36 Grad”、“Männer”等歌词的独创性要素进行细致分析,指出即使存在“幻觉”或文本改动,只要其中仍能清晰识别原作受保护的创意核心与独特表达,就构成法律意义上的改编行为,同样需要获得权利人授权。在免责条款的适用方面,法院系统性地排除了所有可能的抗辩路径:一方面明确AI系统因缺乏人类心智,无法追求“引用”所需的论证目的或“戏仿”蕴含的艺术评述意图,故不能适用《德国著作权法》第51条及第51a条的相关例外;另一方面则指出第53条规定的私人复制例外仅适用于自然人的私人非商业使用,与运营者开展的系统性、大规模复制传播行为有本质区别。
(四)侵犯人格权请求:限定保护边界
在侵犯人格权主张的审理中,法院通过严格的法律解释限定了保护边界。对于部分歌词作品,法院发现模型输出实际将其归属于演唱者而非作词者,这意味着原告主张的“错误归属”缺乏事实基础。对于其他存在错误归属的情形,法院则创设了分层判断标准,认定将改编后的歌词错误归属于原作者,主要影响的是其职业发展与社会评价领域,尚未侵入最核心的私人生活领域。基于个案中侵权影响的严重程度评估,法院认为此类行为尚未达到需要通过一般人格权实施干预的“严重且不可容忍”的门槛。
通过此判决,慕尼黑地方法院完成了对著作权法体系应对AI技术挑战的全面司法阐释。从技术层面的“记忆化”定性,到法理层面的豁免条款限缩,再到运营者责任界限的划分,判决为数字时代的著作权保护建立了一套逻辑严密、前瞻性强的裁判标准。
三、与国外近期裁决的比较
为深入理解慕尼黑法院的裁判思路,可将其与近期两起域外典型案例进行比较:英国的Getty Images诉Stability AI案(伦敦高等法院,2025年11月4日)与美国的Kadrey诉Meta案(北加州地方法院,2025年6月25日)。
(一) 英国Getty Images诉Stability AI案 ——模型权重不视为“侵权复制品”
英国法院采纳专家意见,指出扩散模型学习的是统计模式而非具体图像内容:“Stable Diffusion本身不存储训练数据……模型学习的是统计模式,而非存储训练图像……将所有训练图像存储在权重中是不可能的——LAION-5B数据集约220TB,而模型权重仅3.44GB。”
法院进一步明确,构成“侵害复制权”需满足“实际存储了版权内容”的要件。依据《版权、设计和专利法》第17条及相关判例,即便存储介质为无形载体(如云端),仍属法律意义上的“存储”。然而,Getty未能举证任何受版权保护的作品被模型“记忆”或存储于权重中。法院强调,尽管技术上“记忆”可能发生(如水印高重复出现),但 Getty既未指控也未证明任何训练图像被实际存储于模型权重中。
因此,法院认定,即使训练过程中存在复制行为,模型权重本身并未包含侵权复制品,不构成版权法意义上的“侵权复制品”。该判决的核心在于区分“学习统计参数”与“存储具体作品”,强调“记忆”本身并不足以使模型权重成为侵权复制品。
(二)美国Kadrey诉Meta案 ——关注输出行为与合理使用,未采纳“权重即复制”理论
美国法院在Kadrey案中未将“模型权重”视为复制品,而是将焦点放在训练阶段的复制是否构成“合理使用”,并将“输出反刍”(即当用户向大语言模型提出一个提示时,模型不是基于对问题的理解和推理来生成答案,而是直接从其训练数据中“回忆”并输出一段几乎完全相同的文本。——本文作者注)视为判断市场损害的因素之一。
法院审查了模型是否会在输出中“反刍”原告作品,并发现即便使用对抗性提示,模型生成与原告作品相似的文本也极为有限,属于“微不足道”的程度。法院指出,Meta已对模型进行后训练以防范记忆与输出特定文本,且原告未能提供经验证据证明其市场受到实际损害。因此,法院认定训练行为属于合理使用,未支持原告主张。
该案未涉及“权重即复制”的法律分析,“记忆”仅被视为与市场损害相关的输出风险,而法院认为该风险在本案中未实际发生。
(三)德国GEMA诉OpenAI案 —— 确立“记忆即复制”原则
与英美判决形成鲜明对比,慕尼黑法院在GEMA案中确立了更为严格的标准。法院认定,争议歌词已被可再现地嵌入模型中,无需复杂提示即可重现。法院指出,由于记忆的存在,模型参数中的数据已构成对歌词进行版权复制的前提,无论其具体技术实现方式是存储还是参数反映,关键在于训练数据中的歌词已被可再现地包含并固化在模型中。模型以概率形式表示内容这一事实,并不影响其行为在著作权法上被定性为复制。
法院进一步裁定,模型中的复制不属于TDM例外。TDM旨在评估抽象规则与语义关系,而记忆完整歌词超出了单纯的分析范围,干扰了作者的正当利用利益。此外,法院明确驳回了OpenAI将责任转嫁给用户的企图,认定被告作为模型运营者,选择了训练数据并控制模型架构,对输出内容具有决定性影响,因此应承担直接责任。
综上,英国Getty案否认模型权重本身构成“侵权复制”,强调需证明具体作品被实际存储。美国Kadrey案回避“权重是否证明复制”之争,从“合理使用”与“市场影响”角度裁判,强调输出层面的侵权举证。德国GEMA案则明确将“记忆化”本身视为著作权法上的“复制”行为,无论其技术实现形式,只要作品可被再现即构成复制,并严格限制TDM例外的适用,同时强化了AI提供商的责任。
四、被告上诉的可能性及理由
鉴于本案直接触及AI 核心商业模式的法律基础,且判决结果对OpenAI构成全面不利影响,该判决极有可能被上诉,并且该案件将进入更高的审级。其上诉路径将首先进入慕尼黑高等法院的审理范围,而鉴于案件涉及对欧盟指令的解释等具有普遍意义的法律问题,该案极有可能进一步提交至德国联邦最高法院,乃至通过提请初步裁决程序进入欧盟法院(CJEU)的司法审查范畴。
在诉讼过程中,AI使用这九首歌进行训练是无可争议的。然而,之后发生了什么是一个核心问题:这些歌曲数据是否被记忆(即被存储下来并因此被复制),还是训练数据导致Chat-GPT重新生成了歌词,而没有存储它们?这一争议正是双方在一审中攻防的焦点。OpenAI辩称ChatGPT既未存储也未复制特定的训练数据,而只是通过其参数反映了所学内容,且输出由用户提示生成,责任主体应为用户。然而,法院认定其“偶然生成”歌词的说法站不住脚,并指出歌词在技术上的可再现性构成了版权法意义上的复制。
这一判决的影响可能远远超出歌曲文本的范围。正如马克斯·普朗克创新与竞争研究所的专家Silke von Lewinski在判决前所解释的[2],她认为这对于“所有用于生成式AI的作品,无论是来自文学、新闻文本、音乐、视觉艺术、摄影还是任何其他领域的作品,都具有关键意义。这里涉及的是如何解释现有法律的问题。”她坚信,如果判决被上诉,并且GEMA最终胜诉,这将使得创意产业和科技公司之间的利益天平在一定程度上向作者和著作权人一方倾斜。“那样的话,在文本被用于生成式AI之前,权利人必须给予同意,并有机会获得报酬。”这正是GEMA提起诉讼的目的。
在实质性的上诉争议焦点方面,四个核心法律难题将成为双方攻防的关键:
1.模型参数的法律定性:即技术层面上的“记忆”现象是否足以构成传统著作权法体系所界定的“复制”行为,这需要司法实践对新兴技术产物与经典法律概念之间的契合度作出最终判断。
2.TDM豁免的边界划分:上诉审需要权衡的是,为促进AI 技术创新发展,法律是否应当将训练过程中产生的、在现有技术条件下难以完全避免的模型“记忆化”纳入豁免范围,这实质上体现了创新激励与权益保护之间的价值平衡。
3.责任归属的精细划分:当用户仅使用简单直接的提示词即触发侵权内容生成时,关于侵权责任最终应由掌握模型训练与运营主导权的技术公司承担,还是由发起交互行为的终端用户负责,这需要司法实践对行为关联性与可控性作出更精细的划分。
4.司法裁量的宏观视角:上诉审需要审视在涉及颠覆性技术创新的案件中,法院在颁布禁令时是否应当采用更宏观的视角,将技术发展、市场竞争等社会经济影响纳入比例原则的考量范围,以及是否应当基于产业调整需要给予适当的过渡期,这些都将成为影响行业发展的关键法律判断。
综上,该判决很可能会被上诉,并最终可能提交给欧盟法院(CJEU)。
五、该判决的现实与理论意义
GEMA首席执行官Tobias Holzmüller对此裁决评论道:“互联网不是自助商店,人类的创造性劳动不是免费的模板。我们今天设立了一个保护创作者权利的先例,并澄清了ChatGPT等AI工具的运营商也必须遵守著作权法。”[3]
该判决具有深远的现实与理论意义。在现实层面,判决明确,若模型中存在受保护作品的记忆化,则不能援引TDM豁免,运营者必须获得权利人的许可。这一认定极大地增强了GEMA等集体管理组织的议价地位,将强力推动AI行业走向版权许可模式。这一裁决也引发了政策层面的高度关注,德国司法部长Stefanie Hubig即指出,[4]她预计这场诉讼将对AI公司的许可意愿产生重大影响,并强调“如果许可市场没有显著活跃起来,我们就必须讨论法律调整,而且主要是在欧盟层面”。与此同时,判决也实质上要求大型语言模型开发者必须在技术上尽可能防止记忆化,或彻底清除训练数据中的未授权作品,否则将面临侵权责任,这为行业施加了明确的技术合规压力。此外,判决还带来了直接的经济后果,除禁令外,OpenAI还需披露收入以备计算赔偿,并承担原告的律师费用,面临直接的经济损失。
尽管该判决影响深远,但知识产权专家们对其实际影响范围持谨慎态度。A&O Shearman律师事务所的合伙人Jens Matthes认为[5],“慕尼黑的判决不会严重影响AI提供商的商业模式”。他指出,只有等待美国和欧洲的众多后续诉讼结果,才会最终决定AI模型的未来自由度以及创作者对AI收入的参与程度——如果这些诉讼在结案前没有达成和解的话。这反映出,虽然本案具有里程碑意义,但全球范围内的法律博弈才刚刚开始。
在理论层面,判决实现了法律原则的重要突破。法院首次在司法判决中明确,将作品记忆在模型参数中构成著作权法上的复制,这确立了模型即复制原则,突破了复制品需具备人类可直接读取的传统观念,将复制权的控制范围扩展至AI模型的内部结构。同时,法院对TDM豁免进行了严格限制性解释,严格区分了为分析而复制和分析导致复制,强调该豁免不能成为永久性剥夺权利人商业化利用其作品机会的后门,这一解释明显倾向于保护权利人的商业利益。此外,判决还明确将聊天机器人输出的侵权责任归于模型运营者,确立了运营者对模型生成内容的行为控制权和直接责任,避免了将责任不合理地转移给无法控制模型内部机制的用户。
余 论
慕尼黑地方法院的这份判决,作为欧洲法院首次就AI系统在专业背景下使用受版权保护作品问题作出的裁决,其意义远超个案的成功,是一次系统性和前瞻性的法律定界。该裁决强调,在德国和欧洲市场上,创新的AI系统必须遵守版权规则。法院明确指出,AI的训练和输出都受版权法许可限制——前提是受保护的作品不仅被分析,而且以“以原作形式被记忆,并以近乎原作的形式被再现”的方式被固化在AI模型中。“记忆”代表了一种新的使用形式,超出了单纯的信息分析范围,因此不被TDM等现有限制条款所涵盖。
判决彻底动摇了当前主流AI公司依赖免费爬取互联网数据训练模型的底层商业模式的法律基础,宣告了在严格著作权法辖区如欧盟范围内“未经许可,先训练再说”的野蛮生长时代走向终结。尽管该判决尚未生效,但有充分理由支持AI提供商将来必须与GEMA等著作权集体管理协会签订许可协议,只要其模型使用受保护内容训练且无法排除“记忆”的可能性。AI公司必须将版权许可成本内化为其核心运营成本。
本案同时为GEMA等集体管理组织提供了强有力的维权依据与谈判工具。这些组织今后不仅可以就具体侵权输出提起诉讼,更能直接挑战模型本身的合法性,从而迫使AI开发者主动寻求与权利人和集体管理组织达成一揽子许可协议,否则可能面临模型被禁售或禁用的重大风险。
判决也为AI技术发展划定了明确的合规红线,强调技术上必须致力于防止“记忆化”。这将鼓励甚至强制AI开发者投入资源研发“去记忆化”、实现有效“遗忘”特定训练数据的技术,或建立更精细的数据过滤与授权体系,技术创新不能再以“技术不可避免”作为侵权借口。
作为来自欧盟核心法域的首个全面判决,本案必将对全球其他司法管辖区的立法、司法与监管态度产生示范效应。尽管美国等地区可能存在“合理使用”等不同抗辩路径,但本案所确立的严谨法理分析,将为权利人在全球范围内的维权行动提供坚实的法理支持和战略蓝图。
总之,该判决是著作权法在数字时代的一次标志性胜利,有力捍卫了“原创性表达应得到尊重和回报”这一基石原则,并将其成功适用于最具颠覆性的新技术领域。它标志着AI产业必须从“法外之地”走向“规则之治”,一个注重许可、合规与技术伦理的发展新阶段已经开启。
慕尼黑第一地方法院的判决尚未生效,OpenAI尚未决定是否上诉至欧盟法院。最终鹿死谁手,我们将拭目以待。
附:德国GEMA诉Open AI判决新闻稿[6]
慕尼黑第一地方法院专门负责著作权事务的第42民事庭,于本日的判决中,基本上支持了GEMA对Open AI集团旗下两家公司提出的停止侵权、披露信息和损害赔偿的诉讼请求(案号:42 O 14139/24)。
至于原告另行提出的、因为大模型没有将改动后的歌词错误地归属于原作者而侵害一般人格权的请求,被法庭驳回。
本判决涉及九位著名德国创作者的歌词(其中包括Kristina Bach的《Atemlos》或 Rolf Zuckowski 的《Wie schön, dass du geboren bist》)。
原告是一家德国著作权集体管理组织,其论据是:这些歌词被记忆在被告的大语言模型中,并在用户通过聊天机器人提出简单请求时,作为输出以高度忠实于原作的方式输出。
被告是大语言模型及其衍生的聊天机器人的运营者。他们对提出的诉求提出抗辩:其模型不记忆或复制特定的训练数据,而是在其参数中反映了他们基于整个训练数据集所学到的内容。由于输出仅是用户输入提示词的后果,因此各自的用户应对这些输出承担责任,而非被告。无论如何,任何可能的权利侵害都受到著作权限制的保护,特别是所谓的TDM的限制。
根据判决庭的裁定,原告有权获得所主张的著作权,原因在于歌词在大语言模型中发生了复制,以及在输出中发生了再现(Wiedergabe)。
歌词在大语言模型中被记忆以及在聊天机器人输出中的再现,都构成了对著作权使用权的侵害。这些侵害行为不受任何限制性规定的保护,特别是TDM限制的保护。
法庭确信,涉案歌词以可重现的方式包含在被告的大语言模型ChatGPT 4和ChatGPT 4o中。信息技术研究表明,训练数据可能包含在大语言模型中并可被提取为输出,这被称为“记忆”(Memorisierung)。当语言模型在训练中不仅从训练数据集中提取信息,而是将训练数据原封不动地搬进训练后指定的模型参数中时,即构成记忆。通过将训练数据中包含的歌词与输出中的再现进行比对,证实了此类记忆的存在。鉴于歌词的复杂性和长度,排除了歌词再现系偶然所致。
这种记忆使得涉案歌词以数据形式固定在模型已指定的参数中,构成了著作权法意义上的复制前提——“具象化”(Verkörperung)。 涉案歌词以可重现的方式固定在模型中。根据欧盟《信息社会指令》第2条[7],复制是以“任何方式和任何形式”发生的。在这种情况下,以单纯的概率值(Wahrscheinlichkeitswerte)形式确定是不重要的(在大语言模型中,模型参数记忆的正是数值化的概率,即下一个词出现的几率。法院认为,即使歌词只是以概率值,即数学参数的形式存在于模型中,也构成复制,因为复制权的成立与数据的形式无关。-—— 本文作者注)。新的技术如大语言模型受《信息社会指令》第2条和德国《著作权法》第16条[8]规定的复制权约束。根据欧盟法院的判例,复制权仅要求具备“间接可感知性”,即作品通过技术手段能够被感知或读取。
大语言模型中的这种复制行为,既不受德国《著作权法》第44b 条[9]规定的TDM限制规定的保护,也不通过德国《著作权法》第57条作为非实质性附属物(unwesentliches Beiwerk)而受到保护。
虽然语言模型原则上属于TDM限制的适用范围。但该条款仅涵盖在汇编用于训练的数据语料库时所需的复制(例如将作品转换为另一种(数字)格式或在工作内存中记忆)。其背景是,这些复制仅为后续分析目的而创建,因此不损害作者对作品的使用作品的利益。由于这些纯粹为TDM服务的预备性行为不涉及使用作品的利益,法律未规定对作者的报酬义务。
法庭认为,如果在训练中——如本案所示——不仅提取信息,而且复制作品,则不构成TDM。TDM及其限制规定的前提是:通过对单纯信息的自动化评估本身,不触及使用作品的利益,但在本案情景中,这一前提不成立。相反,由于模型中发生的复制,权利人的利用权利受到了侵害。
鉴于德国《著作权法》第44b条的限制条款的明确措辞,禁止采取另一种可能更有利于技术和创新的解释(即认为模型中的复制也应被限制所涵盖)。 类推适用也不予考虑。即使假设存在立法缺陷,即立法者并未意识到模型中的记忆化及其带来的永久性著作权相关复制,也缺乏可比的利益状况。限制规定通过允许TDM中的预备性复制行为,规范了一种不会危及作者使用作品的利益的情况,因为仅提取了单纯的信息,而作品本身并未被复制。然而,模型中的复制行为严重损害了使用作品,从而侵害了权利人的合法利益。因此,通过类推适用不提供报酬的限制条款,作者和权利人将得不到保护。记忆化的风险完全源于被告的领域。如果类推适用限制条款,将完全由受到侵害的权利人承担这一风险。
由于缺乏主作品(Hauptwerk),涉案歌词的复制不构成《著作权法》第57条[10]规定的非实质性附属物。与被告的观点相反,歌词不能被视为相对于整个训练数据集是次要和可有可无的。要成立该观点,要求整个训练数据集本身也必须是受著作权保护的作品。
被告对原告利用权利的侵害也没有通过权利人的同意而获得正当性,因为模型的训练不能被视为权利人必须预期到的“常规和可预期的使用方式”。
根据法庭的裁决,被告还通过在聊天机器人输出中再现歌词,非法地复制并向公众提供了涉案歌词。在输出中,歌词的原创元素始终是可识别的。
对此,责任人是被告而非用户。输出是通过简单的提示生成的。被告运营着语言模型,这些模型被选中使用了歌词作为训练数据并接受了训练。他们对模型的架构和训练数据的记忆化负责。因此,由被告运营的语言模型对所输出的内容产生了决定性影响,具体的输出内容是由语言模型生成的。
通过输出侵害利用权利的行为,同样不受任何限制规定的保护。
本判决尚未生效。
注释(上下滑动阅览)
【1】GEMA是Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte 的缩写,即德国音乐著作权管理协会或著作权集体管理组织(Collecting Society)。是世界上最大的音乐创作者协会之一,代表德国 95,000 多名作曲家、词曲作者和出版商,以及全球超过 200 万版权所有者。其核心职责是代表其成员(包括作曲家、作词家和音乐出版商)管理他们的音乐作品的著作权。GEMA 的主要功能包括向音乐使用者(如广播公司、流媒体服务等)授予作品的使用许可(管理使用权),并针对此使用收取版税和许可费,随后在扣除运营成本后,根据其规则分配给成员。GEMA 不以盈利为目的,其收入主要用于支付给其成员。在法律地位上,GEMA 在德国的音乐表演权和机械复制权领域享有事实上的垄断地位。它同时代表成员通过诉讼维权,维护著作权人的权益,如同在 GEMA 诉 Open AI 案中所扮演的角色。
【2】https://www.sueddeutsche.de/wirtschaft/muenchen-landgericht-urteil-chat-gpt-gema-urheberrecht-li.3337213 2025年11月11日最后访问
【3】https://www.faz.net/aktuell/wirtschaft/unternehmen/warum-openai-im-urheberrechtstreit-gegen-gema-vor-gericht-verloren-hat-accg-110775055.html 2025年11月11日最后访问
【4】同上注
【5】同上注
【6】由慕尼黑第一地方法院首席法官 Cornelia Kaller执笔,2025年11月11日在慕尼黑作为新闻公布。https://www.justiz.bayern.de/gerichte-und-behoerden/landgericht/muenchen-1/presse/2025/11.php 2025年11月11日最后访问
【7】欧盟《信息社会指令》第2条复制权
成员国应规定作者享有专属权利,以授权或禁止其作品进行全部或部分的、直接或间接、临时或永久性的,通过任何方式和任何形式的复制:
(a) 对作者,涉及其作品;
(b) 对表演者,涉及其表演的录制件;
(c) 对录音制品制作者,涉及其录音制品;
(d) 对电影首次录制件的制作者,涉及其电影的原件和复制件;
(e) 对广播组织,涉及其广播录制件,无论这些广播是通过有线还是无线方式(包括有线电视或卫星)传输。
【8】德国《著作权法》第 16 条 复制权
(1) 复制权 是制作作品复制件的权利,无论复制件是临时性的抑或永久性的,无论采用何种方法、制作多少数量。
(2) 为间接感知之目的将作品转移到另一物质载体上的行为,亦属复制。
【9】德国《著作权法》第 44b 条 (文本与数据挖掘)
(1) 为进行文本与数据挖掘之目的,对作品进行复制是合法的。(注:此款是允许复制的前提。)
(2) 依照第 (1) 款制作的复制件,只要为文本与数据挖掘之目的所需,即可记忆,并须受到适当的安全保障措施保护。文本与数据挖掘完成后,复制件必须删除。(注:此款是法院判定 Open AI 败诉的关键。法院认为LLM“记忆”构成的永久复制,超越了为 TDM 所需的复制,且违反了事后“删除”的要求。)
(3) 如果著作权人已以适当方式声明保留其权利,则不允许利用作品进行文本与数据挖掘。(注:此款规定了著作权人可以“退出”(Opt-Out)TDM 豁免的权利。)
【10】德国《著作权法》第 57 条 非实质性附属物
如果作品被视为非实质性附属物(unwesentliches Beiwerk),而出现在复制、发行或公开再现行为的实际对象之外时,则允许对该作品进行复制、发行和公开再现。
作者:郑友德
编辑:Sharon


