

随着技术的不断创新发展,AIGC逐步成为公众首选的便捷检索、内容制作等的智能媒介。但随着实践泛化,因AIGC生成内容引发的著作权侵权争议也不断涌现,如何确定侵权主体、明晰侵权事实并认定侵权责任成为研究重点。本文即以AIGC运作机制、既有法律规范与司法裁判实践为检视对象,尝试厘明AIGC的侵权风险特性、既有法律规范以及司法裁判观点等基本现状,在此基础上围绕侵权主体、判定标准、主观过错与免责事由等完善构建AIGC生成内容的著作权侵权认定路径,为我国制度完善与司法裁判提供适当的理论方案。

一、引言
随着人工智能技术的更迭发展,人工智能的应用广度与深度不断强化,已然成为培育新质生产力、推动经济高质量发展的重要动能。其中,人工智能生成内容(Artificial Intelligence Generated Content,以下简称“AIGC”)更以其强大的学习能力与自主生成能力备受关注。然而因AIGC有大量的生成内容与在先存在的作品相同或近似,从而陷入著作权侵权的争议泥潭,引发有关AIGC是否有权未经许可复制使用他人作品、如何认定AIGC生成内容与他人作品之相似性、如何界定合理使用在AIGC中的使用边界、AIGC著作权侵权的责任主体认定等争议。尽管我国重视AIGC的规范发展,但立法与司法层面并未就上述争议事项跟进立法或强化裁判说理,使得作品权利人的利益保护诉求无法满足,也难以平衡AIGC运用下的各方利益,不利于推动我国著作权生态的稳定健康发展。对此,本文着眼于AIGC的著作权侵权行为认定问题,深入考察AIGC运作机制,分析其著作权侵权特性与样态,总结立法与司法现状作为研究基础,以问题为导向探索提出我国AIGC生成内容著作权侵权责任认定的路径。
二、AIGC的著作权侵权特点
AIGC生成内容有多重侵权特点:从侵权行为角度,AIGC运行包括数据收集、机器学习及内容生成三个阶段,每个阶段都伴随侵权风险且各阶段的侵权样态不一;从认定标准角度,与他人在先的作品存在“实质性相似”是认定著作权侵权的关键之一,AIGC依托算法比对等技术有意降低与他人在先作品的形式相似性以消解侵权风险,但算法比对的过滤作用并不充分,技术规避呈现失灵状态;从侵权豁免角度,通常行为人以合理利用抗辩侵权指控,但因AIGC生成内容并不在中华人民共和国著作权法(以下简称著作权法)第二十四条明确规定可合理使用的12种情形之列,鉴于放开合理使用可能对著作权人造成较大冲击,故学界大都认为AIGC生成内容不适用合理使用规则。
(一)
“收集-学习-生成”各阶段侵权风险的差异性
AIGC的侵权风险是内生性的,与其数据收集、机器学习与内容生成机制相伴相生,各阶段侵权风险也呈现差异性。把握各阶段的侵权风险,有利于准确认定AIGC生成内容的侵权行为样态,为侵权认定与针对性克服提供基础。
1.数据收集阶段:未经许可的非法复制
AIGC需要海量数据训练构建算法模型以形成生成能力,此过程绕不开对外部数据的收集利用。复制权,依据著作权法之规定,系采取包括数字化方式在内的手段将作品制作一份或者多份的权利。AIGC在未经许可情况下对作品进行数字化转录并复制抓取,就可能侵犯他人作品的复制权。这种侵权风险是相当普遍的,其原因在于我国AIGC关于获取数据使用许可的观念不足,AIGC开发者在数据获取时一是对非电子作品数据化利用,如前所述,此种行为直接落入著作权法的规制中;二是未经许可直接复制使用现存数据库,侵害了数据库所有者权利以及数据作品的复制权;三是非法利用爬虫技术抓取数据,为最大程度获取有用数据,部分AIGC开发者直接突破爬虫协议限制进行网页数据抓取,而网页数据所载构成著作权中作品的,此等行径即是对著作权人复制权的侵犯。AIGC利用上述渠道复制的数据并非单次利用后即销毁处理,而是固定在其自有数据库中进行反复训练利用,是对作品信息的永久复制与持续利用,理应评价为著作权侵权行为,需落实数据来源合法要求,以扭转数据复制乱象。
2.机器学习阶段:侵权风险的吸收与抗辩
进入机器学习阶段,AIGC需将前期复制收集的数据信息转化为计算机语言供下一步利用,此过程可能存在对作品数据信息二次甚至多次复制,有侵犯作品复制权之嫌,故有的学者认为此阶段AIGC也实施了侵权复制行为。但笔者认为,因AIGC内生构造,数据输入后用作机器学习是必然且连续的动作,数据收入是手段行为,涉及对他人作品数据的直接复制攫取,对他人作品法益的侵害更直接与强烈,故有评价为侵犯复制权的必要性;机器学习是目的行为,是基于数据训练目的对内部数据库的复制使用,不对他人作品数据直接“接触”,法益的侵害性较低,如再次认定复制侵权有重复评价之嫌,故笔者认为机器学习阶段AIGC将数据信息复制转化为计算机语言,其复制行为的侵权风险已被前行为吸收,不应重复认定侵犯作品复制权。
此外,机器学习阶段AIGC还会对海量数据转码识别后进行数据特征分析、抽象提取、关联整合等动作,形成可供AIGC学习利用的数据集。此过程可能涉及改编、汇编、翻译等行为而造成著作权侵权。改编权即著作权人允许他人改编作品,创作出具有独创性的新作品的权利,部分学者认为作品数据转为计算机语言的动作有“改编”之嫌,但笔者认为此行径是基于人工智能的固有算法展开,是一种客观的技术行为,不具有创作的主观目的,更难以形成独创性的表达结果,因此不宜认定有改编侵权行为。汇编权即著作权人允许他人将作品或者作品的片段通过选择或者编排,汇集成新作品的权利,机器学习当然涉及对数据信息的拆分与重组,有汇编的可疑性,但AIGC进行拆分、提取与整合动作更具体,其汇编的是作品的数据信息,而非作品本身或作品片段,结果层面与作品的相似性往往较小,故不宜评价为侵权汇编行为。翻译权即著作权人允许他人将作品从一种语言文字转换成另一种语言文字的权利,如广义理解语言转换动作,将作品信息转换为计算机语言确也合理,但考虑计算机技术运用中计算机语言转化的广泛性及著作权保护边界有限性,将上述行为认定为翻译行为将极大限制计算机语言转化,不利于作品信息的数字化传播与发展。故基于利益平衡视角,笔者认为应将著作权法的“翻译”限定为人类语言语种之间的相互转化,AIGC所涉的计算机语言转化不应评价为侵权翻译行为。综上,AIGC在机器学习阶段的相关行为,或系数据收集后的必然行为而被吸收侵权性,或不符合侵权行为要件,综合来看都不应将机器学习阶段单独作出著作权侵权认定评估。
3.内容生成阶段:复制、演绎与信息网络传播侵权
内容生成阶段是AIGC的输出环节,该阶段可能面临复制权、演绎权及信息网络传播权的侵权风险。一是复制权侵权,依照德国乌默教授的计算机“输入-输出”复制权理论框架,AIGC在数据收集与内容生成阶段均有复制权侵权风险。与“数据收集”阶段系对已有作品的数字化复制的手段行为不同,本阶段是面向公众产出相关内容,如果输出内容与在先收集利用的作品存在实质性相似性的,则结果上是可能被认定复制权侵权的;二是演绎权侵权,如前所述,机器学习阶段涉及改编、汇编、翻译等行为,但因机器学习系对数据的转码处理、拆分整合,与侵权的演绎动作不相符。但到内容生成阶段,AIGC依据用户指令与算法模型对数据信息进行改编、汇编、翻译等内容编排,输出为文字、图片、视频等信息而非计算机语言,此时有与他人在先作品产生实质性相似的可能性的,可能诱发演绎权侵权指控;三是信息网络传播权侵权,多数AIGC网络用户可能利用未经授权许可的数据作品用作技术训练,此后生成与在先作品实质性相似的侵权内容并以数字化形式置于信息网络中。该行为割裂了作者与在先作品的联系,侵害作者的信息网络传播权。
(二)
“算法比对”技术在实质性相似判断下的失灵
我国对著作权侵权认定通说采取“接触”+“实质性相似”的判断标准,前者指向被控侵权作品的行为人是否存在接触在先作品的事实判断,后者需裁定者对作品内容及创作表达等进行主观价值认定。为降低与在先作品的相似风险,AIGC通常利用算法技术提升AIGC语言自主性,更普遍的是运用算法比对技术,将拟生成内容与他人在先作品的文字、图片、情节、设定等表达元素充分比对,对高度相似部分进行语序调换、要素替换等操作,以降低与他人作品的相似程度。但这种做法囿于算法的机械与局限,往往侧重形式比对,无法充分过滤实质层面的相似表达,因而存在被识别侵权的可能性。司法实践也表明带入作者的人格化感受,去深入分析作品内容背后的独创性表达才是判定关键。如“琼某诉于某案”中,北京高院以“金字塔理论”为参考,将抽象的思想理解为金字塔顶端,将独创性表达理解为金字塔底端“足以产生感知特定作品来源的特有的欣赏体验”的具体表达,运用该等“抽象分离法”对案涉两部作品的人物设置及关系、情节两个角度的思想与表达进行区分,充分比对两部作品的表达,进而认定两部作品存在实质性相似。
(三)
既有免责规则无法豁免AIGC的侵权指控
依据著作权法第二十四条之规定,行为人可在12种法定情形下非经著作权人允许而合理使用其作品,似乎为AIGC利用他人作品信息而免受侵权指控留下合理使用空间。但深入具体环节,AIGC服务提供者无论是数据收集还是学习产出,其对作品信息的利用往往以训练AI产品为目的,呈现私益性、逐利性,与合理使用的“非营利性”目的相悖,且2023年8月15日生效实施的《生成式人工智能服务管理暂行办法》第七条要求AIGC服务提供者数据来源合法、保护知识产权,第十四、十五条设置了类似“通知-删除”的避风港规则,似乎未给AIGC服务提供者留下合理使用情形的制度空间。但AIGC又确需海量数据作为数据基底与模型训练,此中难免对他人作品复制、利用与传播,如均以侵权论处,无疑为AIGC从业者增加极大发展成本,可能阻碍整个行业的发展,有因噎废食之嫌。因此,AIGC服务提供者有引入免责规则以降低创新成本、保护技术发展的紧迫需要。此外用户的使用是AIGC技术发展应用的直接目的,如不划定合法与违法的行为边界,以免责事由保护用户对AIGC的非营利使用行为,则用户可能不自觉、不定时就会指令生成侵权内容,而反复陷入被诉侵权的泥淖,这显然是不合理的。当前规范层并未明确用户何等行为系AIGC场景下的合理使用,有待完善合理使用规则,厘清用户免责事由、统一裁量标准、捍卫司法公正。
三、AIGC的著作权侵权认定现状
本部分笔者将从立法规范与司法实践二维视角切入,尝试分析我国当前有关AIGC生成内容著作权侵权认定的相关规定及司法裁判实例,基于现状分析尝试厘清问题所在,为后文优化完善著作权侵权认定路径打下基础。
(一)
规范现状:专门规范缺位下的参照适用
从规范效力来看,当前首份生成式人工智能监管文件系国家互联网信息办公室联合其他6部委在2023年7月颁布的《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)这一部门规章,其第四条第(三)项规定提供和使用生成式人工智能服务应尊重“知识产权”;第七条第(二)项规定“涉及知识产权的,不得侵害他人依法享有的知识产权”,划定了利用AIGC的基本行为边界,为AIGC生成内容的著作权侵权认定提供一定的规范依据。需指出,该《暂行办法》系对前沿技术的“紧急”规范,受立法技术与条文空间限制,相关规定都较为原则,未对AIGC所涉的法律风险做全面研判与责任配置,如仅关注到AIGC输入端的数据来源与知识产权侵权等风险,但未提及输出端的生成内容可能涉及的侵权风险,更无力细化侵权行为认定与责任分配等,可见该暂行办法并不完备,无法有效回应当前AIGC生成内容的侵权争议。
之后为了细化AIGC执行规则,2024年3月1日全国网络安全标准化技术委员会发布实施《生成式人工智能服务安全基本要求》(TC260-003),该技术文件用于指导AIGC服务提供者履行备案义务,做好安全评估及保障工作。该文件中“5.2语料内容安全要求”的“(b)知识产权方面”规定了服务提供者的知识产权管理策略及具体保护措施,被援引至“腾某科技(北京)有限公司等与北京百某网讯科技有限公司等著作权侵权及不正当竞争纠纷上诉案”中,以证明服务提供方未尽合理注意义务。该技术文件已成为AIGC生成内容著作权侵权认定的实践指引与适用参考。
而我国其他现行的法律法规对AIGC领域规制仅起到补充作用,例如我国出台的《人工智能生成合成内容标识办法》主要对AIGC生成内容规定刚性标识义务,《中华人民共和国网络安全法》对人工智能技术应用提出网络安全要求,《中华人民共和国数据安全法》要求人工智能技术强化对数据使用、处理、传输、生成等的安全合法性,《中华人民共和国个人信息保护法》则要求AIGC要落实对个人信息的尊重与保护。
综上,因AIGC发展的前沿性以及立法活动的客观滞后性,我国现有的法律法规等正式法源引用中并无关于AIGC生成内容的著作权侵权认定的直接专门规定,相关规范性文件能提供一定的侵权认定参考,在司法裁判中法官往往也将其作为参照性标准。
(二)
实践现状:AIGC生成内容著作权侵权的司法认定
笔者对当前实务部门有关AIGC生成内容涉著作权侵权的裁判案例进行归纳,尝试厘清当前的司法关注要点与裁判规则,为后文厘清著作权侵权认定路径提供实践基础。
从上述裁判案例可以看出,我国自2023年起才开始对AIGC生成内容是否构成著作权及是否侵犯在先作品的著作权作出司法认定,裁判案例体量不大,但整体呈现如下特点:一是涉诉的侵权类型较为集中,通常为图片等美术作品,少部分为视听作品;二是侵权样态较为集中,多为侵犯信息网络传播权,这与AIGC需以含作品信息在内的海量数据为技术基础并受指令生成相似内容,以及用户使用特定作品定向“驯化”AIGC而产出相似结果等普遍现象有关;三是责任主体方面,AIGC服务提供者与用户均可能是责任主体,对用户利用AIGC侵犯他人著作权未采取必要措施的,AIGC服务提供者将承担帮助侵权责任;四是归责原则的区分性。当前AIGC生成内容著作权侵权的归责原则以过错责任原则为主,过错推定为辅,对AIGC服务提供者从注意义务履行与否角度推定有无主观过错,对AIGC用户采取过错原则,考察是否有无生成相似作品的主观恶意。
(三)
现实困境评析:对多元主体的利益保护乏力
综上而言,我国对AIGC生成内容所涉著作权侵权的制度规范还较为匮乏,裁判经验也并不充分。在具体案件处置时,裁判者欠缺规范文件的具体指引,也无法依据统一的裁判规则一锤定音,造成当事人对裁判结果公正性的质疑,普遍引发上诉结果。事实上AIGC生成内容关涉多方主体的利益诉求,对于在先作品权利人而言,其有防范AIGC非法获取及利用其作品的主观动机,在相似作品输出后其有要求法律救济的紧迫需要;对AIGC服务提供方而言,其需要相对宽松的制度环境保证其AIGC实施与发展,有扩大解释合理利用规则的倾向,并通常以自身未直接实施侵权行为来抗辩法律责任;对AIGC用户而言,其当然希望在获取AIGC工具便利的同时免受侵权指控,同时也预期法律制度能承认其利用AIGC产出的作品著作权,那么我国当前既有规范能回应上述诉求吗?答案显然是否定的。作为新兴的法律领域,有关AIGC生成内容的著作权保护与侵权规制制度,需要长期实践积累与规范构造研究才能逐步完善,当前可参照著作权法及其配套制度,在个案正义中逐步统一侵权认定的裁判规则与尺度,尽量平衡保护多元主体的利益诉求。


表1 AIGC生成内容涉著作权侵权认定的裁判案例
四、AIGC的著作权侵权认定路径厘明
针对AIGC生成内容的著作权侵权的认定,主体层面,笔者赞同AI产品的非主体性,司法裁判通常将AIGC服务提供者与用户作为侵权主体;判断标准方面,沿用传统的“接触”+“实质性相似”路径是当前司法部门的一致观点,但笔者建议以“整体观感法”为主,以“抽象分离法”为辅,适配AIGC特性,提升相似性判定准确性;主观过错方面,AIGC服务提供者以未履行合理注意义务为表征,从反向推定过错程度,适用过错推定原则,用户则以重复指令行为、诱导产生相似内容为体现,从正向考察侵权恶意,适用过错原则;免责事由方面,建议将AIGC的“机器学习-模型训练”阶段、用户在通用场景下的非营利性使用均纳入合理使用范围予以免责,对AIGC的“输入”及“输出”阶段的AIGC服务提供方,适用用户免责的侵权阻却以及已尽合理注意义务免责。
(一)
侵权主体:AIGC生成内容侵权的主体厘明
事实上,AIGC生成内容著作权侵权系人机交互中因“人”的原因产生了侵权结果,常见侵权责任主体系AIGC服务提供者与用户。对AIGC服务提供者而言,其往往为AIGC的内部开发提供资金支持、训练数据与算法技术,并为AIGC的外部商业活动提供平台、宣传与服务支持,其在AIGC生成内容著作权侵权中实际扮演着侵权风险制造者角色,直接供给了侵权媒介与侵权内容,应当作为侵权责任主体配置义务。其关键在于认定合理注意义务的履行,包括停止并删除违法内容,警示限制违法使用者,设置投诉举报机制、强化潜在风险提示、落实显著标识义务等,“上海新某华文化发展有限公司诉广州年某公司网络侵权责任纠纷案”以过错推定方式考察上述注意义务,认为AIGC服务提供者未采取必要措施阻止AIGC使用者对案涉作品的侵权传播,故应承担帮助侵权责任。
对AIGC用户而言,其与AIGC服务提供者存在类似于承揽法律关系的联结,用户提出内容生成的具体要求,AIGC服务提供者利用AIGC接受并完成相关“定作”要求。以一般理性人视角出发,用户往往基于快捷搜索与内容制作便利而使用AIGC,并不存在恶意侵权的主观期待,且基于与AIGC服务提供方的类契约关系,其往往有理由信赖生成内容是非侵权性的,且欠缺专业知识的用户并不具备识别侵权内容的能力,可见,无论从事前还是事后层面,要求用户承担相关注意义务通常难度较大,不适宜以过错推定原则进行责任兜底,司法实践中对用户往往也是有过错才归责。
(二)
判定标准:整体观感法为主的实质性相似认定
“实质性相似”本质考察的是独创性表达的相似性,其理论基础是思想与表达的二分原则以及作品的独创性理论,其具体判定方法又可以细分为“抽象分离法”与“整体观感法”,前者系指将作品的思想、事实、通用元素及合理使用部分剥离出来,仅对比检视作品的独创性表达部分,如该等抽象解构足以产生感知特定作品来源的特有的感知体验,则可以认定在抽象层面具有实质性相似;后者系以普通观察者身份对被诉侵权内容与作品进行整体感知,剔除非著作权保护部分,就整体情节串联、整体构图与要素布局等方面进行充分比对,如相似性已达一定足够比例或即使相似性占比不大,但足以使受众感知到来源于特定作品,则可认定在整体层面上构成实质性相似。
因上述二方法在具体认定时均各有局限,司法部门往往综合运用之。聚焦到AIGC生成内容的著作权侵权认定,笔者认为应以整体观感法为主,以抽象分离法为辅,其原因是AIGC生成内容受限于人工智能的语言逻辑以及可能被算法刻意地过滤相似性行为,从而使它的抽象部分与独创性表达难以有效区分,如继续以“抽象分离法”为主进行认定,会加剧裁判者的认定难度,加大误认误判风险。而采取整体观感法更能识别AIGC生成内容侵权相似性的“隐匿性”,从整体层面综合观察感知相似性程度,便于作出更确切的实质性判断。但同时为充分适配AIGC生成内容著作权侵权认定实践,在综合运用二类判定方法时可关注优化如下方面:一是观察者做专业化调整。因AIGC生成内容是基于海量数据与算法模型而产出的内容,其观察对比难度较大,需要判断者熟悉了解AIGC生成内容的特性,以便更好地识别算法“洗稿”等形式伪装,排除不当干扰、直击本质,抓取有效表达做整体对比、识别独创性部分进行抽象分析。因此建议将观察者设定为有AIGC知识背景的专业人员。二是对“实质性相似标准”做泛化处理,严格AIGC生成内容的相似性认定。上海市闵行区人民法院在(2015)闵行(知)初字第59号判决中认为,在文字作品中体现独创性的文字相似度达90%以上的,才构成“实质性相似”。这一标准在AIGC生成内容中基本无法实现,其原因是AIGC侵权内容往往以美术作品、视听作品为主,相似性判定的维度更深入复杂,难以直接统一量化,相似比例可能无需达到90%即可能产生对内容和来源特定作品的感知,故“琼某诉于某案”中北京高院并未就抽象分离与整体感知中的相似比例划定标准线,甚至明确“即使其在被诉侵权作品中所占比例不大”也可构成实质性相似。同时90%的相似度对著作权人的救济设定了较高证明责任与维权门槛,将变相鼓励AIGC提供方及用户的恶意使用行为,可能引发著作权保护危机。对此,笔者认为应降低实质性相似的认定标准,不本末倒置强行量化相似比例,而是聚焦具体案情,从司法公正角度,对案涉作品与疑似侵权生成内容综合运用整体观感法与抽象分离法进行相似性认定。
此外,还有学者提出以“市场替代法”作为辅助判定,该等方法依托于大数据模型与建模分析技术,拟制AIGC生成内容替代案涉作品流入市场,分析流入前后案涉作品的市场占有率、网络点击率、销售数据等内容变化,从市场替代的有效性角度反证作品的实质性相似。笔者认为,该方法以“客观的数据分析”,似乎具备克服整体分析法与抽象分离法主观评价的局限性,但存在以下主要风险,一是可行性风险,该方法的认定结果与作品市场数据的准确性、模型分析的科学性高度相关,但实践中作品的市场数据往往难以准确提供,或提供数据统计端口的公正性受到质疑,导致市场替代中的分析样本数据存疑,使该方法存在严重的可行性风险;二是准确性风险。当前AIGC的生成内容可能仅与部分作品的片段构成实质性相似,作品片段的市场数据往往是不可查的,此时带入整个作品的市场数据进行替代分析,其结果肯定是不准确的,无法有效反推为实质性相似。同时启动该等分析往往需要耗费大量人力物力,以此为代价获得不准确的分析结果,其必要性自不待言。因此,笔者认为,可保留对市场替代法的探索,但不宜将此列为当前的实质性判断的实操方法。
(三)
主观过错:AIGC服务提供者与用户的过错识别
鉴于当前规范中并未对AIGC生成内容侵权责任的归责原则进行专门规定,笔者结合司法实践,建议区分配置归责原则,对AIGC服务提供者适用过错推定原则,考察合理注意义务的履行情况,以强化对侵权风险的控制;对AIGC用户采取过错原则,评估在使用中的独创性表达投入及其合法性来源,以平衡开放发展与权利保护的冲突,以认定对应责任主体的主观过错。针对AIGC服务提供者的主观过错,“上海新某华文化发展有限公司诉广州年某公司网络侵权责任纠纷案”深入考察具体应用场景,分类分层界定侵权责任。以本案为镜鉴,可析出几个方面要点:
一是聚焦具体侵权行为,区分适用归责原则。如AIGC服务提供者直接实施受著作权专有权控制的行为,一般认定有主观过错,适用过错原则,可构成直接侵权。如因用户输入提示词、上传侵权图片等训练语料并决定是否生成侵权内容及公开传播时,AIGC服务提供者的控制与干预能力有限,仅在违反合理注意义务情形下,才可推定有主观过错。对AIGC服务提供者确立过错推定原则,一方面使归责标准客观化,无需考察AIGC服务提供者的主观心态,转为考察客观层面的“作为特定行为”更具实操性;另一方面也降低权利人的证明责任,仅需对AIGC服务提供者有违反合理注意义务情形作出初步证明,即可推定服务提供者与侵权结果的因果关系。
二是综合把握“输入端-输出端”的合理注意义务。本案以《生成式人工智能服务管理暂行办法》为依据,明确AIGC服务提供者有关停止生成与拦截删除违法内容,警示管制违法使用者,预警提示潜在风险,畅通投诉举报渠道,显著标识AI生成内容等合理注意义务。但该等义务有侧重“输出端”之嫌,对“输入端”的义务配置关注不足,建议综合形成涵盖“输入端-输出端”的合理注意义务,包括建立入库数据合法与非侵权性审查机制、构建便捷透明的用户投诉举报机制、建立知识产权侵权风险识别机制、强化知识产权侵权风险信息提示与管控、严格对违法内容的阻止与删除、落实生成内容配置显著标识、建立知识产权策略动态更新机制等,并在个案中全面评判AIGC服务提供者的各项注意义务履行情况,综合评定其主观过错程度,并以此为基础计算赔偿责任。
对网络用户而言,其主观过错的认定则需要考察其在AIGC使用中的独创性表达投入情况,以及该等独创性表达的来源合法性问题。通常而言,网络用户向AIGC发出简单的生成指令且该指令通常不具有作品属性的独创性,其生成内容也高度依赖于AIGC本身的算法模型与数据库储备,因此相关生成内容即使侵权,用户也不应认定为有主观过错。但若用户反复下达具体指令,甚至将非经权利人授权的在先作品进行“投喂”作为生成基础,那么AIGC在有限的表达空间下就极可能对应生成有实质性相似的作品,换言之,用户应适用过错原则进行归责,需严格考察主观侵权恶意。在上述情形下,用户虽进行了有作品属性的独创性表达,但该等表达来源于非经许可的他人在先作品,用户采纳的最终产出内容也与他人作品实质性相似的,此时可认为用户存在主观过错。
(四)
免责事由:AIGC服务提供者与用户的适用路径探索
如前所述,我国当前的规范体系,无论从制度目的还是制度表述上,都没有为AIGC的合理使用确立规范依据。深入考察AIGC运行的各阶段,针对“输入-输出”阶段,分别负担保障数据来源合法与非侵权性、构建知识产权风险防范体系等义务要求,上述二阶段如强行引入合理使用,有帮助逃避主体义务之嫌,不利于对AIGC的规范引导以及权利人的妥善保护,故对此阶段,笔者认为AICG服务提供者可从二维度开展免责抗辩,一是用户免责下的侵权阻却。AIGC服务提供者往往是对用户直接侵权行为承担未尽必要措施的间接帮助责任,但若用户本身不构成著作权侵权或存在免责事由,则基于从属性,AIGC服务提供者也不应承担间接责任。二是已尽合理注意义务抗辩。即使用户确构成著作权侵权且不存在免责事由,如若AIGC服务提供者已采取目前管理规范、技术水平与行业发展下的必要措施进行侵权防范的,可认为其已尽合理注意义务,不应承担法律责任。
针对机器学习阶段,有学者主张可在数据输入后的“机器学习”(含模型训练)阶段引入合理使用规则进行免责。“抖某公司诉亿某科公司侵害著作权及不正当竞争案”中即认为案涉的数据累积与模型训练工作不是著作权法意义的创作行为,更不存在著作权侵权的事实基础。对此,笔者认为“机器学习”阶段对数据的转码分析、归类整合与模型训练是不存在主观恶意的机械行为,不符合复制、演绎、信息网络传播等行为要件、侵权风险被前环节吸收不应重复评价,故可将AIGC机器学习阶段纳入合理使用范畴,豁免对该阶段的侵权评价,营造宽松、创新的发展空间。
针对AIGC用户,为促进AIGC技术发展、提升用户的使用感知,应严格以过错责任评估用户侵权行为,对用户不存在主观恶意的一般使用行为,应纳入合理使用的豁免范围。该等纳入免责的合理使用从目的角度应是有“非营利性”,存在于个人学习、欣赏、科研或公务使用等非商业场景;从行为外观来看,不存在输入他人作品、多次调整参数或调整指令,以引诱生成相似内容等行为。
结语
AIGC是科技的前沿领域,正在不断拓展应用场景与用户群体,有着广阔的发展前景与商业潜力,需要制度规范保障长久有序发展。针对当前AIGC生成内容引发的著作权侵权认定难题,本文从AIGC内容生成全流程,分析“数据收集-机器学习-内容生成”各阶段可能存在的侵权风险,同时结合立法规范与审判实践,评析AIGC内容生成认定著作权侵权的难点痛点,以问题为导向,尝试优化AIGC生成内容的著作权侵权认定路径,明确AIGC媒介的非侵权主体性,AIGC内容提供方是当然的侵权主体,网络用户仅在特定情形下承担侵权责任;建议以整体观感法辅以抽象分离法开展实质性相似认定,沿用过错责任原则进行归责,从合理注意义务履行角度认定AIGC服务提供方的主观过错,同时将AIGC机器学习及用户的通用使用纳入合理使用范畴,避免过分防范侵权而限制正常技术发展与应用需要。当然,上述观点是基于当前专门规范欠缺而给出的权宜之计,有随着实践经验的累积与立法技术的完善而调整的空间,期待以制度的完善强化AIGC内容生成的著作权侵权救济,并平衡保障AIGC相关各方的利益诉求。
