微信扫一扫
文/ 李一同 上海政法学院 21级知识产权
2023年末,北京互联网法院对人工智能生成图片的著作权侵权纠纷一案做出了一审判决,因涉案图片系AI生成,这一简单的著作权侵权纠纷成为司法前沿,引来许多业内人士围观。
首例AI生成图片的著作侵权案入选2023中国法治实施十大事件,这一判决驳斥了人工智能持有说,确立了现阶段AI系统在法律上不具有主体地位,只能被视作一种创作工具,人依旧在法律上被作为作品的作者。其次,使用者利用AI工具从事“文生图”的过程,被认定为创作作品全过程中的一个部分。更进一步,经过人对AI工具“生成物”进行调试、选择等过程后所形成的结果被认定为作品,进而可以受到著作权法保护。判决在事实认定和法律适用方面确立的几个关键性结论,对于未来人工智能相关案件的裁定具有重要的参考价值。
但笔者认为,使用AI生成图片,不可等同于最原始的利用纸张、笔墨等材料进行创作,也不等同于利用数位板和其他电子屏幕进行板绘创作。使用者仅输入关键词和设置参数得出的图片,本质上是“机器学习”作用于图像生成领域的技术成果。人工智能生成物是否构成著作权法意义上的作品,不能一概而论,需要按照现有著作权法体系中的作品认定规则进行个案认定。
下文中笔者将对案例中AI生成图片的技术原理和创作流程进行阐述,并讨论人工智能生成物的著作权归属。
一、对案例中人工智能生成物的技术原理分析
讨论人工智能生成物的著作权归属,首先分析AI生成图片所使用的工具——稳定扩散模型,及其生成图片的过程中对所生成图片起作用的几个关键要素。
(一)稳定扩散模型
稳定扩散模型是基于互联网上大量图片及其对应的文字描述进行训练,相较于潜在扩散模型,它可以利用CLIP模型来分析文本指令中的语义信息与图片中的像素信息之间的对应关系,从而控制图片的生成方向,并生成符合文本描述的图像。生成的新图片并非简单地调用搜索引擎检索的现有图像,也不是按照设计者预先设计的要素排列组合,而是根据AI识别关键词中的图像特征向量对随机噪声图进行降噪后获得的全新图片。
通俗来讲,该模型的功能与人类从经验中学习并积累的能力相似,它能够基于用户输入的文本描述,生成相应形式的图像,以此取代人工绘制线条和上色的过程,将用户的创意和构思转化为具体的视觉呈现。AI绘画原理也可以简单概括为“降噪画图”,即:先随机生成一张噪声图,然后根据文字描述逐步降噪,最终将能看清图片展示出来。AI就像一位木刻师傅,用随机给的木料根据指使人的描述刻出一个作品。
(二)随机噪声图
作为原材料的随机噪声图,系某一现有图片加入高斯噪声向前扩散所得,系统根据高斯分布对原图迭代添加噪声,这一活动中没有留下智力创造的空间,达不到独创性的要求,因此噪声图并非作品;同时,噪声图与原图已无任何相似之处,不涉及侵犯原图著作权。
(三)图片制作过程中的两个重要模型:CLIP模型与卷积神经网络U-net
制作图片过程中,有两个对生成图片起到重要作用的模型:CLIP模型和卷积神经网络U-net。分别对应理解文本和迭代降噪。
CLIP模型可以识别文本指令的语义信息与图片的像素之间的对应关系,从而建立起文本与图片的数据对,将文字与图片对应起来。当AI的用户输入关键词时,CLIP在数据库中选出与关键词中的文本数据具有强对应性的图片数据。在这一过程里,用户输入关键词后,“理解”并“选择”出语义对应的图像由模型完成,使用者对此无智力创造;同时,由于这一过程中的文本编码与图片编码具有强对应性,并无智力创造的空间,因此,使用者对这一具体的文图对应无智力创造。
卷积神经网络U-Net的作用是预测噪声,以对噪声图迭代降噪。其预测方向来源于用户输入的关键词,模型以关键词中识别出的图像特征向量识别、预测出无用的噪声,将预测的噪声在随机高斯噪声矩阵上去除。在这个过程中,用户给出的关键词起到提供特征向量,即影响降噪方向的作用。
对于使用者来说,使用者在AI创作过程中提供的关键词和参数,笔者认为其更接近“思想”的范畴。虽然关键词和参数其对形成的图片的内容起决定性作用,但仅仅提供了方向性的指引;如著作权侵权第一案中原告输入的每一个关键词“超逼真照片”“彩色照片”“日本偶像”“胶片仿真”等,均为简短的文字,且为人们众所周知的一些固定化表达,更符合思想的一部分。这样的指令可以因其数量多少及其组合、出场的顺序、参数的设置而独一无二,但并不直接构成生成图片的表达。用户仅输入关键词和设置参数得出的图片,本质上仍是“机器学习”作用于图像生成领域的技术成果。在本案AI生成图片过程中,用户提供方向性的思想,表达过程则由AI完成;根据思想表达二分法,使用者并非生成图片的作者。
而当指令以其数量和复杂程度详尽到无法进行简单地抽象时,使用者对生成物的影响程度达到一定程度,则可能脱离思想的范畴,而进入被著作权法保护的范畴。
(四)人工智能生成图片的独创性来源
对于人工智能所有者来说,研发设计者们设计了算法和模型,设计出AI生成图片时迭代降噪的公式,预设卷积神经网络对图片生成的作用,对生成的图片具有概括认知。但在人工智能“机器学习”的环节中,人工智能模拟人类的大脑的学习过程进行深度学习,以机器学习模型自己观察、总结、执行,并将积累学习成果。这一过程并没有人类的干预,人工智能通过算法自动地对原始数据进行筛选,自动提取并构建数据的高维特征,使机器自主地从数据中发掘出有价值的内容。以CLIP模型和卷积神经网络为例,文与图的对应、迭代去噪的过程并不可体现所有者对每张生成图片的智力判断和选择。因此,不能认为人工智能是所有者意志的延伸,AI生成物不仅仅体现人工智能所有者的智力劳动。
简言之,AI生成作品的过程中,人工智能所有者设计了算法和模型,人工智能在“机器学习”环节中自主学习,使用者提供关键词和设置参数参数。人工智能所有者和人工智能模型属于前置因素,使用者属于介入因素,其中人工智能没有主体性,故结合人工智能所有者和使用者的贡献度确定人工智能生成图片的著作权。
二、对人工智能生成物的著作权归属的讨论
现有观点中,人工智能持有说、使用者持有说、人工智能所有者持有说、邻接权说、公共产品说均有不足之处。对于类似本案例中使用者使用AI生成作品的著作权归属问题,笔者建议以“约定主义”来解决。
(一)约定主义
约定主义是指当人工智能产品被免费使用时或租赁给其他主体使用时,人工智能程序的所有者与使用者在协议中对人工智能创造物的著作权归属进行约定的,从其约定。 若人工智能的所有者与使用者未约定著作权归属,则使用者享有署名权,其他权利归于人工智能所有者。
在没有约定的情况下,AI生成图片作品的除署名权以外的著作权归属归于人工智能所有者的依据是其对创作作品的贡献度。在生成图片属于作品的前提下,人工智能所有者虽无法凭借其自由意志直接决定生成的内容,但其设计了算法和模型,对人工智能生成作品的过程设定了智力方向,引导和控制人工智能,故判断人工智能所有者的前置因素发挥作用远多于使用者的介入因素。故在人工智能的所有者与使用者未约定著作权归属的情况下,除署名权以外的著作权归于人工智能所有者。
意思自治原则是民事法律关系的基本原则。根据意思自治原则,民事主体可以基于自由意志,通过签订合同等民事法律行为设立、变更或终止与他人的法律关系。因此,只要人工智能所有者和使用者之间对人工智能生成物的著作权归属问题,达成了不违反法律强制性规定的特别约定,著作权的归属应以约定为准。
其中,著作财产权可以约定转让,包括复制权、公开传播权和演绎权等;而包括发表权、署名权、修改权和保护作品完整权在内的著作人身权不可以约定转让,但发表权是具有经济权利性质的著作人身权,与著作财产权紧密相连,可与著作财产权一同转让。故AI生成图片的著作权归属应当以约定的协议为先,协议范围包括发表权和著作财产权。在这一领域,已有多个人工智能公司通过与用户签订的著作权协议来确定著作权归属,例如文心一格在用户协议的5.4知识产权条款中列明由人工智能所有者,而非用户或其他第三方享有著作权。
这一著作权的分配模式,借鉴了影视作品的著作权分配方法,即由创作者享有署名权,其他权利由制作者享有;也可依据合同约定,由创作者与制作者分别享有著作权。 影视作品的这一著作权分配模式将著作权的权利人相对集中,有利于作品的传播和商业化。相较于对影视作品的利用,AI生成图片的后续商业化利用方式尚不明确。
著作权法赋予作者以专有权利,对这些权利提供法律保护,著作权中的“经济权利”——著作财产权,使得著作权人可以以法律赋予的利用方式,利用作品获得合理的经济报酬。
(二)对AI生成图片利用模式的讨论
以约定主义分配AI生成物的著作权权属在技术原理上具有合理性,还能实现著作权权利人的相对集中,防止由于繁琐的权利变动而导致权利利用效率低下。但是,著作权集中于人工智能所有者,当他人想要合法地利用AI生成的作品时,人工智能所有者如何有效利用其著作财产权,与他人进行知识产权的转让或签订许可使用合同,需进一步制定可行的模式。
笔者建议对AI生成物采取技术措施,使得想要利用作品的消费者仅可在付费后下载AI生成物的高清原图,或以其他方式获取生成物的著作权。人工智能的所有者此时体现为人工智能平台,可将AI生成图片分区域对消费者开放。
对于部分AI生成图,如原生内容,消费者无需经过著作权人许可,只要支付一定报酬即可获取AI生成图的著作财产权,报酬按人工智能的所有者与使用者间的约定比例分别汇入平台和使用者的账户;若无约定,则全部汇入平台账户。此部分AI生成图的商业化利用方式借鉴法定许可,即消费者可以直接支付报酬并使用AI生成图。另一部分使用者的贡献因素较大的AI生成图,如伴生内容,消费者可与生成图片的AI使用者在一定范围内协商作品的价格,消费者支付的报酬按人工智能的所有者与使用者约定的比例分别汇入平台和使用者的账户。
此种约定方式简化AI生成图的著作权财产权的利用流程,消费者可方便地接触作品,有利于作品的利用与传播,从而完善人工智能所有者和使用者的利益分配。
三、结语
科学技术进步推动了知识产权制度的建立,科学技术的每一次飞跃都不可避免地引起知识产权制度的调整和更新。诸如人工智能技术的新技术如雨后春笋般涌现并演变,对现有的知识产权制度构成了挑战。人工智能技术本身即代表了人类的智力成果,其在文字、音乐、绘画等多领域的应用日益广泛,且这些生成物越发符合传统的著作权法对作品定义的形式规定,因此,对人工智能生成作品的著作权进行深入研究显得尤为必要。知识产权制度可以通过增加权利或调整制度来应对变化,与时俱进,适应技术的发展。
人工智能在为社会带来巨大的经济效益的同时,也给个人或社会带来风险,生成式人工智能具有复杂与多模态性的特点,应以法律的形式具体分析生成式人工智能及其生成物的定位。立法机构需尽可能地规避风险,探求发展与规制之间的平衡。正如欧盟委员会主席Ursula von der Leyen所言:“为了释放人工智能的潜力,我们必须…在数据流动和广泛使用之间取得平衡,同时保证高水平的隐私、安全和伦理标准。”