李炜 | 基于大语言模型的AI创新的知识产权保护

在人工智能快速发展与全球技术竞争加剧的大背景下,围绕人工智能的知识产权保护日益成为产业关注焦点。2025年12月12日,由YIP Events & 知产前沿新媒体举办的第五届知产前沿人工智能论坛在上海静安铂尔曼酒店顺利闭幕。本次论坛以“AI技术驱动下的知识产权及合规挑战”为主题,围绕生成式人工智能技术在专利申请、数据保护、企业合规和著作权保护中的关键问题展开交流,并探讨 AI 技术对知识产权制度的冲击及人工智能知识产权全球政策动态等议题,为人工智能领域的知识产权与法务从业者提供学习和合作平台,推动我国人工智能产业健康发展。

12月12日上午,上海专利商标事务所有限公司专利代理师李炜围绕“基于大语言模型的AI创新知识产权保护”这一主题,结合日常实践中客户的实际需求,系统性地阐述了大语言模型的知识产权保护策略与路径。


基于LLMAI创新特点

大语言模型(Large Language Model,简称LLM)是一种基于深度学习技术的人工智能模型,专注于理解、生成和处理人类自然语言,具备强大的语言感知与生成能力,是当前人工智能领域最具代表性的技术之一。

基于大语言模型的AI创新,主要有以下方面的特点:

· 

  • 基于大语言模型的语言理解和推理能力。
  • 延伸到具体应用领域:聊天交互、内容创作、知识服务、工具辅助以及行业应用。
  • 涉及多个要素:包括技术要素,还有非技术的要素,那么还有一个比较明显的特点,就是最终落地的产品会呈现人机交互的界面。
  • 涉及多种多样的以及大量的数据:既包括训练模型所需要的训练数据集,也包括模型本身具有的海量的参数。

·

基于LLMAI创新的知识产权保护形式和要点

李炜就基于大语言模型的创新,系统介绍了除专利保护外的其他知识产权保护形式,重点阐述了软件著作权、商标以及数据知识产权三方面的保护要点。

(一)软件著作权

根据《民法典》第一百二十三条规定,知识产权客体包含作品、专利、商标等多种类型。对于大语言模型的研发,软件著作权是保护计算机软件本身的重要形式。

其保护内容及提交材料主要包括两方面:一是计算机程序(如代码指令序列);二是相关文档(如程序设计说明书、流程图、用户手册)。需要注意的是,软件著作权的保护不延及开发软件所涉及的思想、处理过程、操作方法或数学概念。若需保护软件操作中的技术思想,应通过发明专利途径实现。

(二)商标

基于大语言模型的落地产品,常以聊天软件、问答应用等形式呈现。任何能够将自身产品与他人区别开的标志,包括文字、图形、字母、数字、三维标志、颜色组合和声音等及其组合,均可申请商标注册,从而获得法律保护。

(三)数字知识产权

数据知识产权指数据处理者对其依法获取、经一定规则处理、具有实用价值和智力成果属性的数据集所享有的权益。从大语言模型的技术链条看,以下两个环节的数据可能获得此类保护:

1.训练数据集:经过一定处理、可用于模型训练的数据集合,若具备实用价值与智力成果属性,即符合保护条件。

2.输出数据:基于训练好的模型,通过推理过程产生的数据。若推理过程遵循一定规则,且输出具有实用价值,也可纳入保护范畴。

此外,依据《上海市数据产品知识产权登记存证暂行办法》,数据产品知识产权是指对合法获取的数据经实质性加工与创新性劳动后形成的、具有智力成果属性与商业价值的数据产品所享有的权益。申请登记所需材料主要包括:登记申请表、数据产品概述、实质性加工与创新性劳动说明、应用场景说明、承诺书以及数据产品信息。


基于LLMAI创新的专利保护

李炜重点探讨了适用于大语言模型AI创新的专利保护路径,并详细解读外观设计专利与发明专利的申请要点与审查标准。

(一)外观设计专利

基于大语言模型的创新产品常以聊天软件或具体应用的形式落地,其在终端设备上呈现的图形用户界面,可尝试通过外观设计专利进行保护。外观设计是指对产品的整体或局部的形状、图案、色彩或其结合所做出的富有美感并适于工业应用的新设计。涉及GUI的外观设计,其设计要点在于界面本身。提交方式可分为以下三种:

1.以产品整体外观设计方式提交

当设计要点既包含图形用户界面,也包含其所应用的产品(如笔记本电脑、手机)时,需提交该产品(例如笔记本电脑)的相应视图。若设计要点仅在于图形用户界面,则至少需提供界面所在产品的正投影视图,并在简要说明中明确指出设计要点仅限于图形用户界面。

2.以局部外观设计方式提交

对于设计要点仅在于图形用户界面的申请,可采用局部外观设计方式。提交的视图可以包含也可不包含承载该界面的产品(如智能手机)。简要说明中应明确记载“设计要点仅在于图形用户界面(或其局部)”。

3.动态图形用户界面

对于动态图形用户界面,李炜特别指出,许多聊天软件或具体应用的用户界面并非静态单步呈现,而是涉及登录、启动及多个交互轮回的动态过程。

针对此类动态图形用户界面的外观设计专利申请,具体要求是:应当提交图形用户界面起始状态所涉及的视图作为主视图,同时提交体现界面变化过程的关键帧视图作为变化状态图。

通过外观设计专利对终端产品上的图形用户界面进行保护,是保障AI创新成果可视部分的重要途径。

(二)发明专利

1.保护反映算法思想的技术方案

发明专利能够为反映算法思想的技术方案提供保护。作为一项技术方案,其必须首先满足发明专利审查中关于可专利性客体的要求。

这一部分主要依据《专利法》的三个关键条款展开:

首先是《专利法》第二十五条,该条款排除了“智力活动的规则和方法”的可专利性。根据此条的审查实践,若一项权利要求仅涉及抽象的算法且不包含任何技术特征,则将被归入智力活动的规则和方法范畴,无法被授予专利权。在实际操作中,若相关创新方案既包含抽象算法,又结合了具体的技术特征,则可以有效规避此条款的限制。

其次是《专利法》第五条,其规定主要排除那些违反法律、社会公德或妨害公共利益的专利申请内容。在大语言模型AI创新的全过程中,例如在数据采集、标签管理、规则设定及推荐决策等环节,若方案内容触及上述禁止性规定,将因不符合本条而无法获得专利权。

第三个也是最为核心的是《专利法》第二条,它界定了何为专利法意义上的“技术方案”。在判断一项包含算法特征的权利要求是否构成技术方案时,需要整体考量权利要求中记载的全部特征。一个方案能否成为“技术方案”,主要通过“技术问题”、“技术手段”和“技术效果”这三个要素来体现,且三者之间必须通过自然规律相互关联。

在实际审查中,对于涉及算法与人工智能领域的方案,通常通过两种路径使其成为专利法意义上的技术方案:

第一种路径是将算法与具体的应用领域相结合。例如,当算法处理的数据在特定技术领域具有确切含义,其执行过程体现了利用自然规律解决某一技术问题的过程,并能取得相应的技术效果时,该算法方案便构成了可专利的技术方案。

第二种路径则是将算法与计算机系统性能的改进相联系。即使算法处理的数据本身不具备特定领域的含义,但如果该算法与计算机系统的内部结构存在特定的技术关联,能够解决如何提升硬件运算效率或软件执行效果等技术问题,并因此获得符合自然规律的、计算机系统内部性能改进的技术效果,该方案同样可以成为可专利的技术方案。

2.基于LLM的技术创新的典型研发过程

在基于大语言模型的典型创新流程中,创新主体通常从一个已具备通用语言理解能力的基座模型出发。该模型系通过预训练形成。创新主体进而使用特定的训练数据对该基座模型进行后训练,以获得一个精调模型。这一后训练过程旨在:一方面,增强模型的指令跟随能力,使其能更好适配具体任务;另一方面,提升模型在特定领域的适配性,以优化其在该领域的任务表现。

在获得精调模型后,创新主体可向其提供输入,通过模型的推理过程获得相应输出。为验证研发有效性,通常还需将精调模型与基础模型在相同输入下进行推理,并对两者输出的效果(例如准确性)进行比较,以此评估精调模型性能的提升。

在基于大语言模型的创新全流程中,多个关键环节的技术方案有望构成专利法保护的客体。李炜结合典型研发链条,逐一分析了以下四类方案的可专利性路径:

(1)训练模型的方法

该环节指利用特定训练数据集,对已有的基座模型进行后训练,以获得精调模型的方法。若该方法中所使用的训练数据与特定技术领域相关联,旨在解决该领域内的具体任务(如提升模型执行该任务的性能),则该方法本身有望构成技术方案。其技术效果的验证,可通过比较精调模型与基线模型在相同输入下输出的性能提升(如准确性)来实现。因此,完整的训练模型方法可作为发明专利的保护对象。

(2)模型的推理方法和基于其的计算系统

该环节聚焦于后端应用,即利用已训练好的模型,根据输入执行特定任务的推理过程并生成输出。若该推理过程与特定领域的具体任务紧密结合,则其可被视为解决该技术问题的技术手段。其技术效果同样可通过将精调模型的输出与基线模型的输出进行比较来验证。因此,与此推理方法相关的技术方案,以及为实施该方法而专门设计或适配的计算系统,均可寻求专利保护。

(3)生成训练数据集的方法

此环节将保护范围进一步前移,指从原始数据生成用于模型训练的数据集的方法。在某些特定领域,公开或现有训练数据稀缺或效果不佳,创新主体需通过特定技术手段(如数据增强、合成、标注等)生成高质量训练集。其技术效果的验证路径为:分别使用基线数据集与通过新方法生成的数据集训练模型,并比较两者在相同任务上的输出性能。若新方法生成的训练集能带来可比或更优的结果,则该数据生成方法本身有望构成一个可专利的技术方案。

(4)基座模型的训练方法

此环节涉及研发链条的起点,即训练出具备通用语言能力的基座模型的方法。李炜指出,对此类方案申请专利保护存在特定挑战。由于基座模型旨在获得通用能力,其训练通常使用广泛、通用的数据,难以直接与特定领域的技术问题相结合。因此,其要成为专利法意义上的技术方案,其“技术性”往往需要体现在对计算机系统内部性能的改进上,例如,通过创新的训练算法或架构设计,显著提升训练效率、降低计算资源消耗或优化模型收敛速度等。若能证明该方法带来了此类符合自然规律的系统性能改进效果,则其训练方法同样可能获得发明专利保护。


总结

针对创新成果的不同形态,李炜为创新主体提供了明确的保护路径指引:最终产品的品牌标识可通过商标获得保护;产品在终端设备上呈现的图形用户界面可申请外观设计专利;体现核心算法思想的技术方案则可通过发明专利进行保护。

在研发过程层面,产生的软件代码及相关文档可通过软件著作权获得基础保护;而对经过特定处理、具有实用价值的数据资产,则可尝试进行数据知识产权登记,构建数据层面的权利保护。

李炜强调,各类知识产权保护形式在保护强度、申请成本、审查周期等方面各有特点。创新主体应当结合自身的研发重点、预算安排和商业需求,审慎评估并灵活组合运用这些保护方式,从而构建起一套匹配实际、层次清晰的知识产权保护体系,为技术创新成果提供全面而有效的保障。

 编辑:Sharon

分享到微博
分享到微信
    分享到领英

相关文章