IFIF 2026 吴成剑 | 视频领域的技术创新与专利许可

2026年3月11日至13日,由中国领先的知识产权会议策划及知识产权媒体“知产前沿”举办的第四届知产前沿信息通信论坛(IFIF 2026)在深圳前海华侨城瑞吉酒店隆重举行。作为亚太地区最具影响力的标准必要专利(SEP)专业盛会之一,本届论坛以"破局·立势:全球SEP许可的博弈与前瞻"为主题,汇聚75余位来自法院、领先企业及律所的发言嘉宾,与现场近400余位产业界知识产权负责人共同探寻公平、高效的SEP治理新范式。

3月12日下午,InterDigital全球副总裁兼中国区总经理吴成剑围绕“视频领域的技术创新与专利许可”进行了系统分享,从企业发展路径、视频技术演进、标准化实践以及许可模式等多个维度,全面展示了视频产业的创新逻辑与商业化机制。

一、以知识产权为驱动的创新循环模式
吴成剑指出,InterDigital在视频领域的技术创新历程,在很大程度上可视为整个视频行业技术变革的缩影。他介绍,InterDigital成立于1972年,长期致力于无线通信、视频技术及人工智能三大领域的前沿研究。早在20世纪80年代,公司即在美国德克萨斯州部署了全球首个商业无线网络,并逐步成为通信基础研发领域的标杆。

InterDigital一半以上的员工都是工程师,90%的工程师都是发明家以创新发明为他们的日常工作。在全球创新能力评估中,公司已连续五年被LexisNexis评为全球100家最具创新力企业之一,显示出持续稳定的创新能力。
在业务模式方面,InterDigital主要采取以知识产权即业务的商业模式。其基本逻辑是:通过研发和创新形成技术成果,并将其纳入标准体系,与产业界共享;再通过讲技术成功转化为专利组合,并通过专利许可实现对创新的回报,并将收益反哺下一轮技术研发,从而形成可持续的创新循环。吴成剑强调,公司每年要将大约一半的经常性收入再投入到研究和组合开发中,以实现这个良性循环体系。
二、视频技术的历史积淀、演进路径与产业化实践
2019年,InterDigital完成了对法国知名科技公司Technicolor技术资产和研发创新(R&I)部门的收购,后者作为电影与视频技术的百年先驱,为InterDigital注入了更强大的视频技术基因。目前,InterDigital在无线通信、视频和AI三大领域及其交叉地带持续深耕。
Technicolor作为电影工业的传奇品牌,拥有超过100年的技术积累,其彩色摄影技术曾改变了电影工业。从1935年的《浮华世界》(Becky Sharp),到1939年的《绿野仙踪》(The Wizard of Oz),再到1940年的《幻想曲》(Fantasia)等经典影片,Technicolor 的技术贡献早已载入史册,其成果不仅被美国华盛顿特区的史密森尼博物馆收藏,还荣获好莱坞星光大道的专属星形奖章。

吴成剑表示,Technicolor在视频压缩、流媒体和传输等基础性技术方面具有开创性贡献,并在MPEG、JVET、ITU、ATSC、DVB等多个标准组织中发挥了重要作用,在将AI技术应用于视频(如能耗优化等领域)方面处于行业领先地位。
在具体技术实践方面,公司持续推动视频产业基础设施与应用创新。例如,在20世纪80-90年代,公司与法国广播电视机构合作,打造了首个用于电视制作的数字视频演播室,并开发和销售了标清与高清电视之间转换的数字转换设备,同时部署了视频分发所需的光纤系统;在90年代,公司与微软合作开发了全球首款交互式电视系统TAK,并部署早期OFDM设备;进入21世纪后,公司不断拓展应用场景。例如在2010年世界杯期间推出无线高清电视摄像机,在2019年电影《猫》中应用面部捕捉技术,实现真人与数字形象的融合。这些实践体现了公司在视频技术产业化与创新应用方面的持续探索。
三、视频核心技术体系与前沿创新发展
(一)先进视频编码
视频编解码技术的核心在于通过减少帧内与帧间冗余,实现高效压缩,从而显著降低视频传输所需的带宽。其中,预测编码是视频编码的核心技术,可减少视频中连续图像内部及之间的冗余。基于帧内预测与帧间预测,该方法依托于对图像分割、帧内编码模式以及帧间运动场的高效编码,可大幅降低各类视频服务的带宽需求。以影片《Wicked:For good》为例,若未经压缩,其数据量高达约11600GB;而通过当前主流编码标准(AVC、VP9、HEVC、AV1、VVC)处理后,可压缩至约20GB,大幅缩短下载时间,从数天降至数分钟,显著提升传输效率。
从具体流程来看,视频编解码通常包括完整的端到端处理过程。在发送端,即流媒体平台端一侧,原始视频首先需要进行压缩编码处理。该过程一般包括多个步骤:首先对视频进行分区,将画面划分为不同区域分别编码;随后进行预测编码,以减少帧内与帧间的冗余信息;接着通过变换与量化去除不重要的数据,从而降低整体数据量;最后通过熵编码实现无损压缩,在不影响视频质量的前提下进一步提升压缩效率,形成压缩后的视频数据。在接收端,如手机或电视等终端设备,则进行对应的解码过程。具体包括首先进行熵解码(同样为无损过程),随后依次进行反量化、反变换、预测重建以及感知增强,从而逐步还原出可供播放的视频内容。

(二)感知增强技术
感知增强技术的主要目标在于修复压缩过程中产生的失真,并提升最终画面的视觉体验。感知增强主要包括两类技术:一是图像滤波,用于消除并掩盖编码瑕疵(包括块效应、振铃效应、蚊式噪声、闪烁、混叠、颗粒感丢失/过度平滑),对提升感知质量至关重要,并且支持高倍率压缩,节省带宽。二是图像增强,通过引入胶片颗粒等效果,实现符合创作者意图的视觉观感。上述创新技术在不增加带宽消耗的前提下,大幅提升提升压缩视频的感知质量,实现了更优质的体验效果。InterDigital在该领域的技术创新包括基于深度学习的胶片颗粒分析与合成技术、基于神经网络的环路去伪影滤波器技术,以及在亮度映射与色度缩放方面的优化等。
(三)高动态范围HDR
在显示技术方面,吴成剑对高动态范围(HDR)技术作了简要介绍。总体而言,HDR通过提供更明亮的图像、增强的色彩对比度和丰富的细节,从而显著改善视觉体验。该技术最初主要应用于电影制作领域,近年来已逐步扩展至直播场景,尤其在体育赛事直播中得到广泛应用。
在相关技术研发方面,公司率先研发了智能化内容制作工具,实现人工智能在HDR处理中的应用。同时,还研发了动态转换工具,以充分发挥HDR技术的性能优势。与传统的标清SDR技术相比,HDR在亮度表现和色彩层次上均有明显提升。在标准推动方面,公司积极参与HDR相关标准建设,推动在HEVC(H.265)标准中引入10比特画质配置文件,以保障HDR内容的实现与兼容性。在关键技术方面,由InterDigital塑造的关键技术包括后期制作端的色彩标定技术、色域可扩展性技术以及基于单层HDR流的重构与显示自适应等技术,从而进一步提升HDR内容的呈现效果。

(四)新型媒体体验
在新型媒体体验方面,吴成剑指出,未来5至10年视频技术将呈现出更加沉浸化与多维交互的发展趋势,主要体现在以下三个方面:其一,体积视频。该技术通过景深与视差效果,让用户可自由沉浸于视频场景,从而获得更真实的空间感与参与感;其二,数字人。该技术构建用户在现实与虚拟环境中的行为、交互及存在的虚拟化身,提升人机交互的真实感与表现力;其三,触觉反馈技术。该技术通过触觉、动觉、本体感觉与感官错觉,实现物理反馈,使用户在观看或互动过程中获得更为丰富的感知体验。
在技术支撑方面,InterDigital已开展多项关键技术研发,包括基于摄像机阵列的深度估计技术以生成立体视频,基于视频的点云与网格的编码技术,以及基于几何特征的点云编码方法等技术。同时,还开发了融合光照效果的3D表示高斯泼溅技术,以及用于触觉反馈的双参数压缩技术,为新型媒体体验提供了重要技术基础。

(五)创新成果赋能设备及服务
在技术应用层面,InterDigital所研发的创新成果已广泛赋能各类终端设备与视频服务生态。在终端方面,以智能手机为代表,其在4G、5G、WiFi通信、显示技术、视频编解码、视频增强,以及用户界面、操作系统、定位服务、语音控制和投屏等多个功能模块,均融合了相关技术成果。同时,一些技术也被广泛应用于平板电脑、数字电视等设备,既覆盖标准化技术体系,也延伸至多样化的功能性与特征性应用。在服务层面,相关技术同样支撑了视频平台的多元化发展,包括用户界面设计、广告插入机制以及订阅管理等关键环节,体现出从底层技术到应用生态的全面覆盖。
四、技术创新驱动下的专利布局与全球许可实践
(一)全球标准化的主要贡献者
在标准化阶段,InterDigital持续深度参与全球技术标准的制定工作。目前已在多个标准化组织中担任100余个领导职位,覆盖视频、人工智能、蜂窝通信及WiFi等多个关键领域。其中,在人工智能相关标准化组织中亦承担重要角色,包括MPEG下的神经网络与人工智能工作组、ETSI安全架构工作组以及IEEE人工智能常设委员会等。在蜂窝通信领域,InterDigital在3GPP中担任两个主席职位,这一成就在全球范围内仅有少数企业能够实现。
(二)专利组合持续增长
在持续研发投入的推动下,InterDigital的专利组合规模实现显著增长。2017年至2025年间,专利组合由约19000项增长至约38000项,接近翻倍,平均每日新增授权专利约7项。其中,视频技术相关专利增长尤为显著,成为专利布局的重要组成部分。在专利质量方面,根据LexisNexis对专利平均竞争影响力方式评测,InterDigital在5G领域专利质量排名第一,在Wi-Fi领域同样位居第一,在视频编解码领域亦处于全球领先水平,整体体现出较高的技术价值与竞争力。

(三)专利许可领域的领航者
自2021年以来,InterDigital已签署超过40项许可协议,合作对象包括苹果、三星、OPPO、vivo、小米、LG及惠普等国内外企业。许可设备规模方面,2025年单年覆盖约2亿台设备,过去15年累计已超过100亿台。InterDigital的专利组合被广泛应用于流媒体平台,涵盖主流编码标准,如AVC、HEVC、VVC、AV1及VP9,同时还包括HDR、动态字幕、用户界面等功能性专利,形成多元化的技术体系。
吴成剑强调,编码专利不属于标准必要专利,不受RAND条款约束,因此在许可方式上更加灵活。这主要基于两点:一是编解码技术标准或规范仅定义解码过程,不定义编码;二是多国司法实践亦已作出类似认定。例如,巴西法院在InterDigital与迪士尼的案件中,以及美国国际贸易委员会在诺基亚与亚马逊案件中,均确认编码专利不属于SEP;德国慕尼黑法院在博通诉奈飞案件中亦持相同观点。
在专利组合定价方面,吴成剑认为,许可费用的确定应以专利对具体平台所产生的实际价值为核心依据。相同的专利组合在不同平台上的价值可能存在差异,一方面,不同平台所使用的专利范围并不完全一致;另一方面,不同业务模式下专利的贡献程度亦有所不同。在许可收费方式上,InterDigital对不同的付费模式持开放态度,并可根据各平台的具体情况制定差异化的许可方案。
*注:本文所有内容仅为个人基于交流目的的言论分享,仅代表个人当下的观点输出,不代表本人固定立场,同时也不涉及、不代表任何公司或团队的官方立场与态度。
编辑:Sharon
相关文章
|
关注公众号
|
联系小编
|
|
| 电话:+86 18917798290 | ||
| 地址:上海市嘉定区陈家山路355号创新创业大厦 | ||


分享到微博
分享到微信
分享到领英
