诚如观点

诚如研究|AIGC多领域应用模式及著作权归属讨论

2023-09-01 403

前言

百度创始人李彦宏将AIGC的终极形态总结为“原创时代”,即可以独立产出具有独特价值和视角的作品。逐渐的,人工智能体的不断进步,未来可能实现由人类下达目标,AIGC自主产生过程内容,解决宏观或微观层面超过人类可及算力的复杂问题;或由AIGC自主分析需求,自主产出内容,即“AI原创”等复杂情形。本文将对不同情况下的AIGC进行分析。

 

PART.1  AIGC发展的几个阶段

AIGC全称为AI Generated Content,即人工智能生产内容。AIGC既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合[1]。

1.AI技术最早被应用于内容生产领域主要以工具或“助手”的身份,也即应用型人工智能。工具身份主要是辅助缩短机械化的信息收集、调研等工作的时间,提升内容产出效率,助手角度则进一步辅助内容生产,实现语音合成、图片合成、影像合成等,将创作者(人)的创意进行成果作品化,实现从脑海创意到客观存在的过程。此时的AIGC只是作为一种辅助,主要的创作过程、创作方向由人进行设定,产出的结果受人的精确控制。另外一个层面上,此阶段的AIGC只能在限定领域和范围内解决问题,更多地呈现为定向工具。

2.随着技术的革新及海量数据库的分析合成,逐渐产生了AIGC参与度更高、自主度更高的应用模型,通过给定特定的限定词、创作场景、创作风格而实现内容产出,这样产出的结果在最终产出之前,并非精准符合创作人的设想,或者说创作者仅仅构思好了输入的限定条件,而对于结果的产生并非精确预见控制。此阶段则大幅度提升了AIGC参与产出内容的相对比例,产出的结果只需要符合创作人的简单描述,而未必符合创作人的设想与控制。此时的AIGC逐渐叠加复合通用的知识,能够处理多任务高效协同处理,能够处理涉及多层面多领域的复杂问题。

3.最终,AIGC可能可以实现所谓的“AI原创”,即通过布置抽象任务,由AI自主处理复杂多样的任务,并在无需人工干预的过程中产出多元复杂的成果。本文主要针对现有的AI应用领域分析应用模式及著作权归属问题。

 

PART.2  AIGC的多领域应用模式

1.文字创作领域

undefined

AIGC应用于文字创作领域主要难点在于使得机器理解自然语言的同时输出符合人类语言规律与语言习惯的自然语言,此项技术在各个领域已有较好的应用模式。

对于结构化强的文本生成,其交互性相对较弱,在邮件、函件公文、制式内容自动生成等应用场景下,只需要建立足够完整的规范化应用条件与应用目标,即可输出符合结构要求的内容,在技术层面上已有较多成熟的应用。

对于结构化不强但交互性较强的场景下,反而对于个性化和差异化要求较高,比较有代表性的就有因具备反馈性学习能力与高度拟人化而闻名的ChatGPT。

 

2、音频生成领域

undefined

音频生成又分为语音模仿生成和音乐生成。语音模仿生成主要是基于事先录制的给定的语音库及对于文字转语音平仄语调变化的应用模型,已广泛应用于自动语音库及内容生成的配音领域。

音乐生成在理论上也比较类似,通过对于事先录制的音乐音色作为库,通过音乐数据转化的机械数据及训练的符合乐理及给定的规范化应用模型生成音乐内容。早在2021年,AI就已经能够完成贝多芬《第十交响乐》。但建立此类应用模型比起语言模型而言还需要具备专业音乐知识,进行的数据构建需要符合音乐领域的规则。其次,音乐内容生成领域的范围内,对于价值函数的定义与标签化也更具复杂,即需要定义什么样的音乐符合音乐领域的美感、什么音乐属于什么样的风格的问题。

 

3、视频生成领域

undefined

视频可以被认为是连续播放的图像,但视频的内容需要具备一定的审美或内容。从审美角度而言,能够生成逐渐变化的高质量图像,前后具备一定的关联性即可符合此要求。从内容角度而言,则要求模型具备一定的“表达”,这种表达可以是文字形式(字幕表达),可以是语言形式(配音表达),也可以是图像形式(故事表达),前两种表达的形式需要应用模型具备文本生成和图像生成能力;图像形式表达则除了文本生成能力和图像生成能力之外,还需要进一步赋予应用模型图像与自然语言转换的能力,例如以图像的形式表达人物的情绪及行为、场景的变化等复杂情形。

 

4、图像设计领域

undefined

图像设计领域现如今已是AIGC最为广泛的应用领域之一。Transformer模型解决的是如何把图像翻译成计算机语言,同时通过自然语言转化的计算机语言再次转化为图像;Clip模型通过对文本和视觉特征相互匹配,能够更好将图像特征与文本描述形成对应,使得计算机能对图像分析更具体、更有标签化,例如将“红色的”、“上圆下尖”、“带有杂色小斑点”的特征与“草莓”进行匹配,实现对图像-文字双向匹配的深度学习;Diffusion模型则是以通过对样本增加干扰,后去除干扰并最终生成符合条件的清洁、高质量图像,这一过程为了并便于读者理解,可以粗暴地理解为将一段中文文字先翻译成英文,再翻译成法文,最后翻译成中文的过程。实际上,这个过程将被分成非常多的部分,并最终进行符合条件的拼接。

 

5、游戏领域

undefined

在影视剧《偷偷藏不住》中,剧情中男主作为游戏公司的核心开发曾提出一个观点,通过增加NPC的个性化交互,增加游戏的丰富性与用户的可玩度。在游戏领域实际上对应着前述的文本生成、音频生成、图像及视频生成的复合应用,包括剧本开发、任务设计、场景设计、人物动态交互设计等。当游戏领域应用的AIGC训练的足够成熟时,该复合型AIGC未来也可以直接适用到元宇宙的建设中。同时值得一提的是,在基础设施齐备、算力充足的情况下,未来也有可能满足使用者也作为创作者,通过自行给定规则与条件生成内容的条件,人人自行打造自己的元宇宙或许能够实现。

 

PART.3  不同模式的AIGC知识产权归属问题

前面对于当前主流的AIGC应用有了一个简要的描述,也对未来的AIGC应用有了初步畅想,下面将对AIGC的知识产权归属问题进行分析

1、AIGC工具角度

对于使用AIGC进行过程性工作,例如数据收集、调研等方式,使用目的往往只是为了节省人力,产出的往往未必能被直接称之为著作权法意义上的“作品”,且也不具备何种争议,故此处不加以讨论。

此处讨论的情形主要指以AIGC作为工具,使用目的是制作出精确符合作者思想的智力成果,或对已有智力成果进一步渲染完善,产生的AIGC作品,例如通过预设模版,输入给定条件和特殊内容,最终形成的制式合同、商品说明书、产品模型图等。因生成的内容属于具有人类构思的独创性、表现形式,且比较直接、明确地属于人类的智力成果。在此种情形下,能够明确感知到作者的构思、意图,即能够感受到“人类作者身份”,一般均被认定为AIGC工具使用者构成作者的身份。

 

2、AIGC创作角度

在此情形下,人类的创作比例逐渐降低,人类的智力成果更多地体现在一些抽象的表述或前提条件的提供上,而由AIGC完成最终内容排布生成。

首先,就其是否具备著作权的角度而言,我国法院对其著作权予以认可。2019年,腾讯诉上海盈讯科技有限公司未经授权许可,抄袭腾讯研发的机器人Dreamwriter撰写的文章,腾讯方陈述作品为其工作人员使用涉案软件Dreamwriter完成,涉案文章并有载明“本文由腾讯机器人Dreamwriter自动撰写”。受理法院认为,该文章表现出“最低限度的创造性”,从分析文章的外在表现形式和生成过程来看,该文章源自创作者个性化的信息筛选和排版,并由智能写作助手软件在技术上合成的创作过程满足著作权法对文字作品的保护条件,因此,法院认定涉案文章属于我国著作权法所规定的文字作品[2]。

其次,应当对作品产生的各个层面进行论述首先针对AIGC使用者的创作是否应当认可的问题。笔者认为,使用者对于给定表述或前提条件时也应当视为对作品的设计与排布,例如针对绘图设计领域,目前广泛应用的方式为给定prompt提示词进行作品生成的方式,在这种情形下,提示词对于作品的最终产生至关重要,甚至已经衍生出了相应的市场,例如PromptBase平台中用户可以通过挑选、参考最终生成图,向相应用户购买特定提示词。可见限定条件对作品各个元素的设计排布具有不可排除、至关重要的作用,体现了作者的智力成果,具有著作权。

值得一提的是,对于独创性问题在此类AIGC中有较大的问题。因技术限制,现有AIGC绝大部分都是通过深度学习及大数据库进行模型建立的,在内容生成中可能出现他人作品的部分相似或重复的情况,且该情况并不少见。对于此等情况,作品的独创性应当是有待商榷的。对于已通过降噪处理实现内容清洁化的部分而言,应当认可其独创性;对于重复或相似部分的内容,应当对在先作者构成侵权。如AIGC使用者使用未经数据授权的不合规AIGC软件,且生成内容后也未自行取得数据来源的许可,应当构成侵权。如AIGC的使用者使用的软件承诺已取得相关数据的授权,然而实际上并未取得相应的授权,则使用者可以就其用户协议进行合法来源抗辩,而AIGC所有人则应当承担侵权责任。

另外,即使AIGC所有人取得了数据来源的授权,是否应当认可其享有生成内容的著作权或邻接权呢?对此,有部分学者认可因AIGC的唯一或单一,而限定方式丰富多样,系AIGC使用者对于限定条件或者说对作品元素排布的方式决定了作品,作品最终也符合使用者的创作意图,而AIGC所有者在主观层面上甚至都没有创作该作品的意图,因此著作权应当归属于AIGC使用者。还有部分学者认为,因程序的核心是代码,而代码或应用模型也对作品内容的生成发挥了至关重要的作用。且最终生成的内容为符合限定条件的千千万万个作品,并不能认为AIGC使用者当然地取得生成作品的著作权,而应当由AIGC使用者与所有者共同享有著作权。

 

3、AIGC原创角度

此情形目前暂无实例,但已有许多知名学者、企业家对此进行了激烈的讨论与积极的尝试。在此范畴内,可以由AIGC独立产出具有独特价值和视角的作品,对此情形产生的内容是否构成著作权以及著作权的归属又该如何处理呢?

首先,此种情况下,既然已经实现“AIGC原创”,则应排除人为提供限定条件与限定范围生成内容的情形。产出内容本身可能无法直接体现人类创作意图或对该指定内容的独创性,但对于能够开发出具有原创能力的AIGC的所有者是否能够就“作品的衍生品”赋予其相应知识产权呢?根据《著作权法》第九条规定,著作权人包括:(一)作者;(二)其他依照本法享有著作权的自然人、法人或者非法人组织。而AI并非著作权保护对象,故AI首先无法取得著作权。

笔者认为,对于能够开发出能够自主原创的AIGC所需投入的时间精力绝非等闲,如果因此产出的内容却不能得到法律的保护,将会打击开发者的研发热情,阻滞人工智能开发事业蓬勃发展,宏观层面上也将限制我国人工智能水平的国际竞争力,进一步阻却人类的历史进步。其次,虽然AIGC自主生成的内容并无法直接体现人类意志的独创性,但也因其系代码运行的产物,系软件开发者能够预见的产出内容或产出方向,符合最低限度的独创性要求,可以以作品进行保护。

从反面考虑,如果“AIGC原创”内容不符合作品的著作权最低限度要求,那在能够鉴别作品是否为AI自动生成的途径或方式产出之前,基于人性的考虑,势必会导致部分实际上为AI自动生成的内容在无其他权利人提出相反主张的情况下被错误地认定为符合著作权法意义上的作品进行保护,也可能会导致人类创造作品因证据不足及裁量权受技术限制的客观情形而失去法律的保护,这与著作权法的内核与初衷背道而驰。

 

PART.4  结语

科技的发展有自身的客观规律和客观基础,并不以科学家或司法者的主观意志为转移。法律通过对科技事物的干预既能起到保障促进作用又能起到延缓阻碍作用,法律工作者应当正确地认识科技,具备足够的科技素质,继而从科学的内容和方法中提高效率,公正高效地司法;同时,法律也应当促进知识经济的发展,对科技智力成果、知识产权进行保护,促使科技更好的发展,引导人民对知识的敬畏与向往,推动人类文明的发展与进步。

 


【参考文献】

[1] 人工智能生成内容(AIGC)白皮书(2022年)--中国信通院中国信通院

[2]中国知识产权报 原标题:《腾讯诉上海盈讯公司著作权侵权案一审胜诉——AI独创亦有版权》

 

undefined

本期供稿

undefined