
2025年10月23日,广州知识产权法院组织开展知识产权司法服务保障发展新质生产力典型案例发布暨专题研讨会,会上发布了10起知识产权司法服务保障发展新质生产力典型案例,涉及高端芯片、生物医药、5G技术、开源软件、植物新品种权等前沿领域。其中,第8起案例涉开源软件的相关法律规范和司法规则。
近些年,如DeepSeek等企业在开源生态中的角色与表现,正日益成为衡量企业技术创新能力与行业影响力的关键维度。邦信阳人工智能与数字经济全国业务委员会长期为涉开源软件的客户提供法律服务,近些年也为部分客户在引入开源数据、选择和修订开源许可证、搭建开源数据平台提供相关服务。
基于这些经验,本文以广州知产法院发布的典型案例为引子,从企业引入开源软件和开源数据的法律要点、两者的差异进行比较分析,以期为读者提供法律借鉴。
文 | 万波
广州知产法院发布“罗盒公司v玩友公司”一案的核心是软件开源许可证(GPL v3),而数据开源与软件开源不同,并不适宜直接援引软件开源许可证,从目前的实践来看,数据开源平台较为普遍的是引用知识共享许可协议(Creative Commons License,通常简称“CC协议”)。
如上海人工智能实验室打造的OpenDataLab数据开放平台中,“蜜巢·花粉1.0开源数据集就整体采用了CC BY-SA 4.0许可协议:

又如,库帕思打造的语料运营公共服务统一门户中,也有较多开源数据集采用了CC 协议,如下述AlphaFold DB蛋白质结构预测数据集采用的就是CC-BY-4.0许可协议。

事实上,不仅在国内的开源社区中,在GitHub、Kaggle等国际开源社区中,使用CC协议作为数据开源的情况也不在少数。
CC协议是允许他人分发作品的公共版权许可之一。2002年12月16日,美国非盈利性组织Creative Commons首次发布了CC协议,先后经历了CC 1.0、CC 2.0、CC 2.5、CC 3.0、CC 3.0美国、CC 3.0各地版本,但目前官方推荐版本是2013年发布的CC 4.0版本。CC 4.0版本具体包括如下许可证类型:
许可证类型 | 简称 | 图标 | 要求 | 允许事项 |
公有领域 | CC0 |
| 放弃所有权利,将作品置入公有领域 | 任意使用 |
署名 | BY |
| 署名 | 商业使用、修改、分发 |
署名-相同方式共享 | BY-SA |
| 署名、相同方式共享 | 商业使用、修改、分发 |
署名-禁止演绎 | BY-ND |
| 署名、禁止演绎 | 商业使用、分发 |
署名-非商业性 | BY-NC |
| 署名、非商业 | 修改、分发 |
署名-非商业性-相同方式共享 | BY-NC-SA |
| 署名、非商业、相同方式共享 | 修改、分发 |
署名-非商业性-禁止演绎 | BY-NC-ND |
| 署名、非商业、禁止演绎 | 分发 |
除了CC协议以外,数据开源还可以使用开放数据共享许可协议(Open Data Commons)可以使用,在其官网上(https://opendatacommons.org/)也可以查到其目前三类的License类型,分别为ODC-ODbL、ODC-BY、ODC-PDDL,具体如下图:

软件开源许可证与数据开源许可证二者虽同属“开源”理念,但在开源对象、法律基础和传染性上存在较大不同,具体见下表:
对比维度 | 软件开源许可证(以GPLv3为例) | 数据开源许可协议(以CC-BY-SA为例) |
开源对象 | 计算机软件的程序代码。保护的是代码的“表达”,即其独特的结构、序列和组织。 | 版权作品,如图片、文章、音乐等。对于数据,保护的是其对内容的“独创性选择与编排”,而对于尚缺乏独创性的数据,则属参照适用。 |
法律基础 | 主要基于《著作权法》 和《计算机软件保护条例》。“罗盒公司v玩友公司”明确将其认定为附解除条件的软件著作权许可合同。 | 主要基于《著作权法》 对一般作品的保护,数据的集合若具有独创性则受保护。单个数据本身不直接属于CC协议保护的版权对象,但可参照适用。 |
传染机制 | 强传染性(Copyleft),这是GPLv3的核心。任何衍生作品(如修改、链接GPL代码)都必须在相同许可证下发布整个源代码。在“罗盒公司v玩友公司”一案中,法院认定玩友公司基于VirtualApp开发的整个产品都被视为衍生作品,需要整体开源,否则违反了GPLv3协议导致许可自动终止。 | CC-BY-SA 虽然也要求“相同方式共享”(Share-alike)。但其传染性相对GPLv3要弱。要求如果公开分发基于授权作品的“演绎作品”(Adapted Material),则必须在相同许可证下进一步分发。但它不具有GPLv3的“横向传染性”。 |
主要义务 |
|
|
“罗盒公司v玩友公司”的启示 | 法院认定,违反GPLv3不仅构成违约,还导致其使用源代码的软件授权自动终止,后续使用行为构成著作权侵权。这体现了软件许可证的强约束力和病毒性。 | 虽然该案未涉及CC协议,但其法理相通,违反CC协议同样构成违约和可能的数据侵权。 |
“罗盒公司v玩友公司”一案,为使用开源数据的企业和个人敲响了警钟,揭示了现阶段以下值得审慎尽调的几个核心法律风险:
1、许可证违约风险
风险描述:无论开源方选择的是GPLv3这类软件开源许可证还是CC协议这类数据开源许可证,使用开源软件或数据的主体,都需要您对许可证条款准确理解,如理解不清或忽视其法律效力,极可能造成许可证项下违约,常见的合规陷阱包括:
混淆“使用”“修改”与“分发”:对于使用开源软件的主体,内部使用软件并不会触发传染条款,但忘记一旦软件修改或分发,即可能触发软件许可证义务。
误解“衍生软件”:如同玩友公司,认为只要不是直接复制代码就不算衍生。但GPLv3认为,与其代码静态链接或深度集成的作品,都可能被视为衍生软件,从而必须开源。
对“演绎作品”的约定不明:按CC-BY-SA协议的规定,如果公开分发基于授权作品的“演绎作品”(Adapted Material),则必须在相同许可证下进一步分发。但是对于不构成版权作品的数据,如何适用CC-BY-SA,可能存在争议,从而给开源数据的使用方带来法律的不确定性风险。
忽略署名要求:即使是MIT、Apache等宽松软件许可证或不带“传染性”的CC协议等,也要求保留原始版权声明和许可证文本,忽视该等许可证义务,也可能导致开源协议自动终止、从而侵犯在先知识产权和数据权益的风险。
违反“非商业性使用”要求:如CC BY-NC协议下的数据用于商业产品,如训练商业AI模型并收费。
2、开源代码或数据本身侵权风险
风险描述:数据库因其内容的“选择或编排”具有独创性而受著作权保护,数据如属于重要数据需受到《数据安全法》的保护,个人信息则需保护个人信息权益主体的相关权益。譬如,当使用的开源数据集本身是他人未经授权爬取的“非法”数据,那么即使您已经完全遵守了开源许可证,也可能因使用源头有问题的数据而卷入侵权纠纷。
又如,如开源数据本身为有偏见或歧视性的数据,您如果基于此类数据训练AI模型并投入使用,可能导致歧视性结果,引发产品责任和声誉风险。
3、“传染性”导致的自身机密或数据泄露风险
风险描述:如果自身闭源软件或保密数据中不慎引入了GPLv3或CC-BY-SA等传染性代码或数据,可能导致整个软件项目或“衍生数据”被要求开源,从而使您自身商业机密或保密数据被迫公开。
4、许可证兼容性风险
风险描述:在一个项目中使用了多种不同许可证的开源组件或开源数据,这些许可证可能互相冲突。例如,您不能将一个要求使用GPLv3许可的组件和一个禁止使用GPL的组件合并到同一个衍生作品中。又如,当您要将多个不同CC许可证(或与其他协议)的数据集合并创建一个新数据集时,会遇到复杂的兼容性问题。例如,您不能将CC-BY-NC的数据与ODbL(要求相同方式共享且允许商业使用)的数据混合发布。
为了有效防范引入开源软件、开源数据的风险,建议您采取适当的管理措施,如:
进行适当的许可证合规审查:在引入任何开源软件、开源数据前,审查其许可证,并评估其对自身产品的潜在影响。
进行数据合规与伦理审查:核查数据内容是否包含个人信息、敏感信息,评估数据的偏见和公平性。
建立数据溯源机制:记录所有使用软件和数据的来源和许可证,确保可追溯。
商业使用需谨慎:明确区分“非商业性使用”和“商业性使用”的界限,必要时寻求直接授权。
培训员工:让开发人员和法务人员都充分理解不同开源许可证的法律含义和义务。
寻求法律意见:在复杂或不确定的情况下,寻求专业人员的意见。
建立开源管理流程:建议符合组织内部实际的开源软件、开源数据的管理流程。
综上,无论是软件还是数据,“开源”不等于“无主”或“免费”或“随便用”,它是一套建立在法律之上的、有明确规则的权利义务体系。您在享受开源红利的同时,宜建立起与之匹配的合规意识和风险管理能力,才能行稳致远。
BOSS & YOUNG
律师介绍

万波
上海邦信阳律师事务所 合伙人 📍上海
wanbo@boss-young.com
万律师主要执业方向为金融证券、金融科技、人工智能与数字经济领域,现为邦信阳人工智能与数字经济全国业务委员会主任,并任中国个人信息保护合规审计推进小组成员、上海市律师协会数据合规与网络安全专业委员会委员、上海大数据联盟成员、上海数商协会成员、上海仲裁协会数字经济与人工智能研究委员会委员、基于川渝的部省协同公路行业可信数据空间联盟理事等社会职务。具有国际云安全联盟(CSA)认证数据保护官资质,被China Business Law Journal连续评为2022年“A-List”法律精英,2023年、2024年“The Visionaries睿见领袖”,入选律新社“2024年度数据合规领域品牌之星匠心律师”,2024年度LegalOne实力之星(Stellar Accolade)。曾于2023年出版《数据与个人信息疑难问题法律指引——基于251则典型案例的分析》专著,并牵头撰写《2024人工智能与数字经济法律研究报告——银行保险篇》、《2024人工智能与数字经济法律研究报告——公共数据运营篇》等专题报告,并办理了上海首批2个“上海数据”品牌认证项目、全国交通行业数据产品挂牌及数据资产入表第一单项目、上海数据产品知识产权融资第一单项目等。
系列文章
Boss & Young Since 1995
法治兴邦·知行于信·大道向阳
使 命:让律师成为法治社会的重要助推
愿 景:法治天下·诗意栖居
价值观:可靠、高效、富有创造力,守正、相与、永葆进取心

来源:邦信阳律师事务所
编辑:鱼仔
责任编辑:高兴、陈默
声明:本文仅代表作者本人观点,不得视为邦信阳律师事务所及律师出具的正式法律意见或建议。转载请注明来自“邦信阳律师事务所”公众号。如您有意就相关议题进一步交流或探讨,欢迎与我们联系,电话:+8621 23169090,邮箱:shanghai@boss-young.com

点击“阅读原文”,登录邦信阳律师事务所官网了解更多资讯。