
随着全球人工智能浪潮的持续高涨,以大模型为核心的AI科技公司已成为资本市场关注的焦点,MiniMax Group Inc.(下称“MiniMax”)和Knowledge Atlas Tech Joint Company Limitied(下称“智谱AI”)等行业内代表性公司近期已先后向香港联交所提交上市申请,拟依据《主板上市规则》第18C章(特专科技公司)寻求上市,引发了广泛关注,而无论是VC/PE、并购交易还是IPO,全面识别与评估AI模型公司的相关法律风险都至关重要。
邦信阳人工智能与数字经济全国业务委员会的成员长期关注“AI与算法”领域的产业发展与法律需求迭代,帮助客户系统认识和防范AI大模型开发、部署和使用中重点问题和法律风险,积累了较为丰富的经验。
基于这些经验,考虑到不同的AI产业链参与者面临的法律风险亦不相同,为了便于处于不同行业的企业更全面了解AI领域的行业现状、发展趋势、法律要求、尽调要点,我们尝试从收购方的视角进行研究分析。
本文作为该系列文章的组成部分,以MiniMax、智谱AI等行业内代表性公司的招股说明书为主线,梳理了投资并购AI大模型公司需关注的重点法律问题。
文 | 万波
四、投资并购AI大模型企业的尽调重点
3、客户集中度及违约风险
AI大模型公司的可商业化收费模式,主要包括:(1)项目制(本地化部署):一次性或分期收费,金额高但客户集中,交付风险大。(2)API调用收费(云端部署):按量计费,收入可预测性强但客户粘性低。(3)订阅制:多为C端产品,依赖规模效应。
MiniMax和智谱AI对其该风险相关披露如下:
尽调维度 | 企业名称 | 招股说明书相关披露 |
客户集中度及违约风险 | MiniMax | (1) 我们以MiniMax M2、Hailuo-02和Speech-02为核心的自研大模型组合,具备长上下文处理能力,可理解、生成并融合文本、视觉、音频等多种模态。这些模型支持着我们的核心AI原生产品——包括MiniMax、海螺AI、MiniMax语音、Talkie/星野,以及面向企业和开发者的开放平台,为全球用户提供极致的智能体验。截至2025年9月30日,我们的AI原生产品累计为来自超过200个国家及地区的逾2亿名个人用户,以及来自超过100个国家及地区的10万余名企业以及开发者提供服务。 (2) 我们于2023年、2024年及截至2025年9月30日止九个月,来自我们于往绩记录期间各年度/期间的五大客户的收入分别为210万美元、1,340万美元及1,160万美元,分别占我们相应期间总收入的60.5%、44.1%及21.7%。 (3) 通用大模型行业正在经历多个维度的快速创新。从技术角度看,进步包括(i)混合专家及其他稀疏激活网络等新模型架构,改善了推理性能与计算效率之间的平衡;(ii)扩展的上下文窗口和多步骤推理机制,使模型能够理解更长的文档、执行复杂的分析任务并作为自主智能体;(iii)多模态通用大模型,能够同时处理和生成文本、图像、音频和视频,实现更自然和更具上下文信息的人机交互;及(iv)改进的训练前和训练后技术,提高了模型的准确度,允许模型根据特定业务用途进行量身定制。 (4) 客户需求在不断演变。用户和企业客户日益寻求:(i)功能强大的通用大模型,以整合跨多个领域的知识,更高效地利用其专有上下文来满足特定行业的使用场景;(ii)更低的延迟和更高的成本效益,从而能够在消费者和企业应用中实现大规模实时使用;(iii)更强大的隐私、安全和数据治理功能,以满足监管义务和内部控制;及(iv)具备持久记忆、工具集成和自主任务能力的AI系统,能够实现主动、类似智能体的性能,而非简单的一次性响应。这些趋势正在加速行业转型,促使领先参与者持续投资于模型算法、计算基础设施、对齐以及围绕通用大模型构建的安全功能。 |
智谱AI | (1) 我们拥有广泛且多元化的客户群体,并在往绩记录期内实现了快速扩张。我们的客户包括企业、公共部门实体及个人用户。我们的企业、公共部门实体客户数目如下:
(2) 2022年、2023年、2024年及截至2025年6月30日止的六个月期间,我们来自前五大客户的收入分别占总收入的55.4%、61.5%、45.5%及40.0%。 (3) 我们的成功取决于MaaS平台的质量、可靠性和效率。任何不足之处都可能导致客户不满、错失商业机会或损害我们的声誉。具体而言,我们MaaS平台的成功表现取决于以下因素(包括但不限于):(i)客户对MaaS平台的接受程度;(ii)平台交付具有前景的模型与应用的能力;(iii)我们部署方案的多样性;(iv)我们平台的相对可靠性与稳健性;(v)我们为不同垂直行业客户开发新应用的能力;(vi)MaaS平台定价模式的竞争力;(vii)我们持续升级、推进和创新平台及技术的能力;以及(viii)我们紧跟技术与行业趋势并持续推进平台发展的能力。 |
总体而言,AI大模型公司的可商业化收费模式目前仍相对单一,因此,法律尽调时需关注:
客户集中度风险:严重依赖少数大客户,单个客户流失影响巨大,如MiniMax、智谱AI前五大客户收入占比都曾超60%。
合同违约风险:服务等级协议(SLA)中关于模型性能、可用性的承诺,以及责任限制条款(如对间接损失的豁免),往往是纠纷的焦点。本地化部署合同还涉及IP许可、售后支持边界等复杂问题。
收入确认争议:项目制收入确认依赖复杂的验收条款,需关注产生回款延迟或争议的风险大小。
4、分发渠道风险
AI大模型的分发渠道通常包括:
自有渠道:如自研App(如MiniMax的“海螺AI”)、官方网站。风险在于用户获取成本高、规模增长慢。
第三方渠道:(i)嵌入硬件(手机、汽车):需与硬件厂商深度合作,议价能力可能受制于人。(ii)通过云市场分发(如阿里云、华为云市场):受平台政策影响大。(iii)通过API集成至第三方应用:渠道控制力最弱,易被替代。
开源渠道:如智谱AI开源GLM系列。可迅速建立开发者生态和影响力,但可能分流商业产品潜在客户,并需管理社区贡献带来的知识产权混杂风险。
MiniMax和智谱AI对其该风险相关披露如下:
尽调维度 | 企业名称 | 招股说明书相关披露 |
分发渠道风险 | MiniMax | (1) 我们部分产品的用户需要访问互联网及主要应用分发渠道,如苹果App Store、Google Play、其他知名应用商店,以下载若干AI原生产品。我们的移动应用在该等第三方分发渠道的任何中断、限制、暂停或下架或其条款、审查政策或技术要求的任何变化均可能对我们获取用户及交付产品的能力产生重大影响。 (2) 2024年12月,我们的Talkie应用历史版本在若干司法管辖区暂时自苹果App Store下架,为期约两个月。据我们所深知,Talkie应用此次从苹果App Store临时下架,并非因产品存在缺陷或存在违法行为,且苹果并未说明下架原因。因此,从2024年12月中旬至2025年2月中旬,在若干司法管辖区的苹果App Store无法下载历史版本的Talkie应用,且Talkie应用的日均下载量较下架前的平均水平减少了约1.68万次。自2025年2月中旬起,更新后的Talkie应用已在苹果App Store上架供用户下载。 |
智谱AI | 未涉及 |
2021年,苹果App Store和谷歌Play Store下架了多款违反其数据隐私政策的应用程序,导致相关开发商的收入瞬间归零。我国互联网平台间相互封禁API接口或屏蔽链接的行为,也曾引发广泛关注,如果AI模型公司的服务严重依赖某个分发渠道,如该渠道因各种原因被关闭,业务也将受到重创。因此,法律尽调时需关注:
标的公司收入对各分发渠道的依赖程度,评估核心渠道合作的排他性、稳定性及分成条款。
如采用开源策略,需审视其与商业化产品的边界是否清晰,社区治理规则是否完善。
5、牌照与资质风险
AI模型公司运营所需的牌照和资质,除了一般意义上的电信业务牌照,还有一系列基于业务内容的备案、评估与安全审查义务。
算法备案:根据《互联网信息服务算法推荐管理规定》,具有舆论属性或社会动员能力的算法推荐服务提供者需履行备案手续。
生成式AI服务备案:根据《生成式人工智能服务管理暂行办法》,提供具有舆论属性或社会动员能力的生成式AI服务,需进行安全评估并备案。
生成式AI服务登记:对于通过API接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能,需履行登记手续。
增值电信业务许可:若运营在线平台或提供特定在线服务,可能需办理ICP、EDI等许可。
高新技术企业认定:享受税收优惠(如企业所得税减按15%),需持续满足研发投入、知识产权等条件。
MiniMax和智谱AI对其该风险相关披露如下:
尽调维度 | 企业名称 | 招股说明书相关披露 |
牌照与资质风险 | MiniMax | (1) 我们已按照关于生成式人工智能的中国法规,为我们的专有模型(包括“abab”模型系列、“abab多模态”模型系列和“MiniMax”模型系列)向上海市互联网信息办公室进行必要的模型登记备案。对于涉及算法推荐技术提供在线信息服务的应用服务,我们已通过互联网信息服务算法备案系统完成算法备案程序,并取得相应的备案结果。在适用的情况下,我们还在网站和应用的醒目位置披露备案信息和备案编号。
|
智谱AI | (1) 在往绩记录期及截至最后实际可行日期,我们已从相关政府部门取得开展实际业务运营所需的所有重要执照、许可、批准及证书,且该等执照、许可、批准及证书均处于完全有效状态。下表列载了截至最后实际可行日期我们所持有的主要执照及许可的详情。
(2) 根据现行中国监管框架,多个政府部门(包括但不限于工业和信息化部、公安部及国家互联网信息办公室)共同负责监管本行业的主要方面。规管我们业务活动的现行及未来法律法规的解释和实施日后可能会不时发生变化。如果我们未能完成、取得或维持所需的任何牌照或许可,或未进行必要的备案,我们可能会面临各种处罚,例如没收受影响业务运营所产生的收入、处以罚款,以及被终止或限制相关业务运营。任何此类处罚均可能扰乱我们的正常业务运营,并对我们的业务、经营业绩、财务状况及发展前景造成重大不利影响。 |
欧盟《人工智能法案》对高风险AI系统实施严格的事前合规评估,类似于中国的安全评估。国家网信办等七部门联合公布的《生成式人工智能服务管理暂行办法》生效后,已有多个未履行备案手续或登记的算法服务被责令下架或罚款。因此,法律尽调必须核实标的公司是否已完成其业务模式所必需的各项评估、备案与登记手续,以及高新技术企业认定的条件是否持续满足。
6、AI训练数据来源的风险
训练数据是大模型的基础,其合法性是根本的风险源之一。
侵犯知识产权:使用受版权保护的文本、代码、图像等进行训练,可能构成侵权。尽管存在“合理使用”等抗辩空间,但法律边界模糊,面临诉讼风险。
侵犯个人信息:使用包含个人信息的数据未进行充分的匿名化处理,或未取得合法基础(如知情同意),违反《个人信息保护法》。
不正当竞争:非法爬取或使用竞争对手受合同或技术措施保护的数据进行训练,可能构成不正当竞争。
MiniMax和智谱AI对其该风险相关披露如下:
尽调维度 | 企业名称 | 招股说明书相关披露 |
AI训练数据来源风险 | MiniMax | (1) 在模型训练方面,我们使用经合法授权的数据集以及其他合法可用的公开数据。此类训练数据不涉及客户数据或可识别自然人的个人信息。我们采取多种措施确保训练数据的质量和可靠性,包括但不限于:(i)从专业数据供应商处获取数据;(ii)制定详细的标注指南;(iii)执行严格的人员管理;(iv)开展培训和评估以确保标注质量和一致性。(v)通过标注及识别不良或不当内容,降低模型生成非法、歧视性或其他不良信息的风险。(vi)基于这些数据集,我们还邀请领域专家生成专门为满足我们特定需求量身定制的高质量训练数据。对于训练数据,我们采用筛选和测试问题等方法,以确保公平性、非歧视性以及遵循第三方权利。 (2) 我们的训练数据可能包含未经所有必需第三方许可的第三方文本、视频、图像、音频或其他内容。规范使用该等数据训练基础模型的法律框架仍在发展,并可能有所变动。若我们使用训练数据被具备管辖权的主管机构发现侵犯第三方知识产权,我们可能面临高成本且耗时长的诉讼,被迫支付巨额赔偿或许可费,或被要求删除数据并重新训练我们的模型,而这将是一项困难且成本高昂的工作。 (3) 此外,我们允许用户输入内容,以在我们某些产品上获取人工智能生成的输出,这可能使我们面临与第三方著作权相关的潜在争议和责任。鉴于用户提供内容的数量、用户输入内容的方式以及自最初输入内容以来所经过的时间,我们通常无法准确识别和核实输入或提供该等内容的个别用户、该等内容的著作权状况,以及应从中取得著作权许可的适当著作权拥有人。此外,倘个人用户在我们若干产品上提供侵权内容,他们可能没有足够资源向我们悉数补偿任何该等申索(即使能够补偿)。此外,该等措施可能失效或被法院或其他相关监管机构视为不足。我们可能须与用户共同承担侵权责任,这可能对我们的业务、财务状况及声誉造成重大不利影响。 |
智谱AI | (1) 我们通过自主运营的应用程序(如移动应用、微信小程序及其他线上平台)在获得用户直接授权的情况下收集数据,在用户使用我们的服务之前,我们会事先通知用户,告知将要收集的数据类型及其用途,并取得用户的同意,同时承诺根据适用法律管理和使用所收集的数据。具体来说,我们收集、存储及使用的用户数据一般包括:(i)用户的基本信息,如手机号码;(ii)用户与我们的AI产品交互产生的数据,包括用户输入数据(如提示词、问题、图像、音频文件、文档及其他信息)以及我们产品生成的内容;(iii)用于安装及运行我们移动应用程序的设备属性信息,如设备标识符。 (2) 同时,我们也从其他来源获取数据以提供服务。这些来源包括:(i)第三方供应商:主要包括文本、图像、语音及视频数据,用于训练并优化我们的模型。(ii)开放网站、公共数据集或其他可公开访问的来源:主要包括公开可获取的文本、图像及类似的内容,用于训练并优化我们的模型。我们主要依靠开源数据来训练我们模型的通用能力,例如广泛的语言理解和生成以及基本的逻辑推理。而使用第三方供应商的数据集主要用于行业特定训练,因为高质量的专业数据在公共来源中相对稀缺,从第三方供应商采购的数据集通常具有更高的质量、准确性和可靠性。除非机构客户明确委托我们获取任何数据用于提供服务的特定目的,否则我们不会从我们的机构客户或其终端用户那里获取任何数据。 (3) 我们从第三方供应商、公共网站、公开数据集或其他公开可访问的来源获取训练数据。我们无法保证所采取的措施能够有效促使或监督这些第三方供应商或公共数据控制方遵守适用的网络安全、数据保护及个人信息保护法律法规。如果其中任何一方未能或被认为未能以合法合规的方式获取此类数据,或未能遵守相关的网络安全、数据隐私及保护法律法规,则可能对我们的服务及声誉造成重大不利影响。此外,由于当前的数据处理技术存在固有局限性,我们无法保证在进一步处理数据之前,能够有效地对从第三方供应商及公开可访问来源获取的数据进行过滤、脱敏或匿名化处理,以完全符合相关法律法规的要求。 |
全球与AI训练数据有关的纠纷目前呈“多点开花”的局面,《纽约时报》诉OpenAI和微软案是标志性案件。时报指控被告未经许可使用其数百万篇文章训练AI模型,构成版权侵权,并损害其商业利益。意大利数据保护机构曾于2023年暂时禁止ChatGPT,因其涉嫌违反GDPR,包括非法收集个人数据用于训练、缺乏年龄验证机制等。国内有关的司法案件也已出现,如广州互联网法院和杭州中院的AI生成奥特曼案等。
因此,法律尽调时需关注:标的公司的AI训练数据来源以及根据不同来源的差异化风险防范,是否建立了一套涵盖法律、技术、管理等多个层面的综合体系。同时,目前国内外司法对涉AI“合理使用”的判定存在差异且处于动态调整过程之中,也需尽调团队密切关注司法与政策动态。
系列文章
BOSS & YOUNG
律师介绍

万波
上海邦信阳律师事务所 合伙人 📍上海
wanbo@boss-young.com
万律师主要执业方向为金融证券、金融科技、人工智能与数字经济领域,现为邦信阳人工智能与数字经济全国业务委员会主任,并任中国个人信息保护合规审计推进小组成员、上海市律师协会数据合规与网络安全专业委员会委员、上海大数据联盟成员、上海数商协会成员、上海仲裁协会数字经济与人工智能研究委员会委员、基于川渝的部省协同公路行业可信数据空间联盟理事等社会职务。具有国际云安全联盟(CSA)认证数据保护官资质,被China Business Law Journal连续评为2022年“A-List”法律精英,2023年、2024年“The Visionaries睿见领袖”,入选律新社“2024年度数据合规领域品牌之星匠心律师”,2024年度LegalOne实力之星(Stellar Accolade)。曾于2023年出版《数据与个人信息疑难问题法律指引——基于251则典型案例的分析》专著,并牵头撰写《2024人工智能与数字经济法律研究报告——银行保险篇》、《2024人工智能与数字经济法律研究报告——公共数据运营篇》等专题报告,并办理了上海首批2个“上海数据”品牌认证项目、全国交通行业数据产品挂牌及数据资产入表第一单项目、上海数据产品知识产权融资第一单项目等。
Boss & Young Since 1995
法治兴邦·知行于信·大道向阳
使 命:让律师成为法治社会的重要助推
愿 景:法治天下·诗意栖居
价值观:可靠、高效、富有创造力,守正、相与、永葆进取心

来源:邦信阳律师事务所
编辑:鱼仔
责任编辑:高兴、陈默
声明:本文仅代表作者本人观点,不得视为邦信阳律师事务所及律师出具的正式法律意见或建议。转载请注明来自“邦信阳律师事务所”公众号。如您有意就相关议题进一步交流或探讨,欢迎与我们联系,电话:+8621 23169090,邮箱:shanghai@boss-young.com

点击“阅读原文”,登录邦信阳律师事务所官网了解更多资讯。