Skip to main content

Command Palette

Search for a command to run...

庭审笔记04 | ai文生图案(上)

Updated
1 min read
庭审笔记04 | ai文生图案(上)

A lawyer from China Canton, this blog is about Internet law stuff and tools using methods, with a blogging time and output we could get more.

案件背景

原告使用AI文生图工具,生成AI美女照片,并发布于个人网络平台账号。后照片由被告自媒体账号作为图文插图使用(未注明出处去除了原告个人水印信息)。

原告起诉被告,要求赔偿赔礼道歉。

本案事实情况清晰,作为AI工具生成照片纠纷第一案,如何对AI图片的定性,是关注重点。

一、原告

1、原告诉请

(1)请求人民法院判令被告发布公开声明,向原告赔礼道歉,消除其侵权行为给原告造成的影响。

(2)请求人民法院判令被告赔偿原告经济损失 5000 元。

2、事实和理由

原告作为网络自媒体创作者,在2023年2月24日使用开源软件Stable Diffusion(以下简称SD),通过输入提示词以及设定参数和模型的方式生成了涉案的美术作品。后原告将该美术作品以春风送来了温柔为名,在2023年2月24日发布于小红书平台。近日,原告发现被告使用其百家号账号股市云开日出在2023年3月2日发布了名为三月的爱情在桃花里这篇文章。

该文章题图使用了原告的创作的前述作品,但未获得原告的授权或者许可,在被告发布时截去了原告在小红书平台的署名水印,使得相关用户误认为被告为该作品的作者。基于上述事实,原告认为原告通过 ai 绘画工具Stable Diffusion完成涉案美术作品,合法享有该美术作品的著作权限。被告未经原告许可,通过百家号平台使用了原告创作完成的该美术作品,并且截去了原告的账号署名,严重侵犯了原告享有的信息网络传播权及署名权,已构成著作权法第五十三条所规定的侵权行为,被告应当赔偿原告的经济损失并进行赔礼道歉、消除影响的行为。

笔者注:本案“作品”使用事实部分很清晰。

3、原告提交补充证据

(1)Stable Diffusion软件开源协议、绘画模型的使用协议;

  • 证明相关开源协议,约定用户可以免费使用,开发者不主张用户生成相关内容的相关著作权;

二、被告

1、被告答辩

(1)被告认为,原告使用免费AI工具生成的图片,可以直接被第三方使用;

(2)被告行为造成的影响十分有限。

  • 今年3月份使用后,5月份已下线,未给原告造成多大损失;

  • 被告公众号主营内容为诗词、文章等文字内容的分享,粉丝受众群体年龄较大,并非绘画、插图的直接受众;

  • 原告、被告均为自媒体经营人员,系个人爱好者,粉丝数量不多,粉丝不是名人,未给原告造成很大损失;

(3)被告行为并非故意使用。

  • 被告使用本案争议图片,功能和使用目的,仅用作文章插图,系误用,没有商用盈利;

  • 被告在文章最后,已注明图片来源于网络,没有主观故意去使用争议图片;

  • 图片来源于网络,使用时已是去除水印的状态;

(4)原告主张5000元赔偿额,要求赔偿额过高。

  • AI工具生成的图片,市场价值不高,淘宝平台仅需支付1-2元,可以采买很多张;

笔者注:被告未聘请律师自己出庭答辩,语序上有一些混乱。对内容进行了归纳总结。

2、被告提交补充证据

(1)淘宝、拼多多、闲鱼等平台,AI图片售卖页面截图。

  • 证明AI图片交易价格低廉,获取方式便捷、容易;

  • 证明AI照片生成便捷,输入提示词对应生成人物图片,普通人均可生成AI照片,无实际门槛。原告主张索赔额过高;

三、争议焦点及辩论

本案争议焦点:

1、原告主张权利的图片是否构成作品,属于何种作品。

2、原告是否享有涉案图片的著作权。

3、被诉侵权行为是否构成侵权以及侵权责任的承担。

关于第一个争议焦点,原告主张权利的图片是否构成作品?属于何种作品?

(原告当庭申请屏幕共享,展示Stable Diffusion软件下载、安装,环境部署,生成AI图片的过程)

原告:

1、SD软件的安装、部署、打开流程

(1)首先原告在哔哩哔哩搜索相关用户的信息,由B站的用户秋叶AAKR进行了软件的发布。原告访问了其主页,在主页看到了他当时发布的相关的整合包、百度网盘下载地址。整合包,是B站用户为软件整合添加了UI界面,最终形成目前软件的版本。

(2)原告访问百度网盘,下载安装所需要的文件,既包括SD软件本身,也包括涉及软件的整个绘画模型。不同的绘画模型会决定画面输出的风格是写实的还是动漫的,还是说是针对某些特别物体的。需要向法庭强调的是,SD系美国公司开发的软件,其前期AI绘画依赖的训练素材是欧美,因此官方模型对于生成亚洲人脸支持度并不优秀,整体生成的画面效果与(亚洲脸模型)是完全不一样的。

(3)原告依据地址下载压缩包,部署了SD以及绘画模型的环境,可以看到B站用户,在安装包中,附加了用户协议说明,这个是基于AIGC技术学习,是基于开源项目制作,并提供了算法的运行环境。用户协议中,同时提及了,不得有明显的违法行为,因数据产生收集、处理使用的相关事项,造成的责任由用户自行承担,没有限制说明使用者生成的版权的归属问题。

(4)当原告打开启动器时,每一次均需在本机器上重新做一遍部署,由于SD是开源软件,处于不断更新的过程中,安装完成后,本地其实有一个整体的部署过程,需要整合整个软件包相关内容。因此每一次开机、关机后,均会走一遍部署流程。B站用户这样出于方便原告等无网络基础、技术基础的用户制作启动器,主要目的是提供SD软件的启动,同时他也声明了启动器是免费提供的。

(5)操作界面的左上角,可以看到使用的绘画模型,默认提供的模型数量比较有限,用户可以自行于网络寻找开源模型并下载导入本地源文件。然后原告依据输入的关键词,进行了输入,选择模型和相关的参数。

2、SD文生图的操作流程

(1)勾选绘画模型,模型中第一个功能即文生图。功能的使用是输入一个正向提示词,并输入一个反向提示词,输入提示词后设置部署迭代采样方法,设置宽度、高度、p数等引导词的系数,同时搭配开源组件的其他功能,设置完成后可以生成图像。

(2)原告所生成图像,主要依据的是关键词。选取模型,输入关键词,然后再调整参数,最终达到原始的绘画效果。涉案作品,原告最初想画一幅在黄昏光线下这个具有写摄影风格的这个美女特写。需说明的是,开源软件,对于人类自然语言的处理支持度并非十分完善,若原告没有经过调整直接输入关键词,生成的效果不会符合原告的需求。

(3)比如我们在这里选取了同样的模型,设置了同样的这个部署和底这个宽度、高度等效果。同时我们也启用了同样的绘画模型,也设置了和原告所绘画的同样的权重,那整个过程设置完之后就可以自动生成,在界面右侧会生成相关图像。

笔者注:SD软件功能界面。

Ciel:【Stable Diffusion学习笔记】3.界面功能详解-文生图

3、提示词等参数输入

(1)本次原告通过输入正向提示词“在黄昏的光线条件下,具有摄影风格的美女特写”,法庭可以看到,单纯正向提示词,生成的绘画作品其实与涉案作品存在差异,原因是AI工具存在局限性,无法特别好的理解自然语言。因此,原告认为,AI工具(经不同的操作者)在创作高度上有区别。

笔者注:关于正向提示词与反向提示词。

(2)本案中,原告使用的提示词,是经过学习、社区讨论后生成的,提示词中包括了艺术类型、主体环境、构图和相关风格的条件设定,即绘画生成的主体是日本的女偶像,然后同时也设置了脸部、皮肤、眼睛、头发、腿部等细节,同时也注明了环境为外景,写明了具体的时间是黄昏落日前一个小时,注明了灯光效果为动态灯光。写明了希望的绘画风格为电影照片风格,同时参照其他用户的设置,注明了摄影的镜头。整个过程均体现了原告所独创的选择。输入上述参数标准后,输入随机的种子数,可以还原并生成同一幅涉案图片。

(3)原告认为在整个的这个绘画的这个创作过程中,模型的选取、正向负向提示词、选择哪些关键词,以及设置怎样的宽度高度,设置怎样的引导词系数,都会对结果产生重大的影响。每一步的选择或者是每一步的输入,都能体现出就是原告所进行的干预,在这个干预过程,能体现出原告审美的趣味。生成结果,采用哪种参数更为合适,均是原告在长期的积累学习和其他社区用户讨论得出的,上述过程中,对于开源软件的选取,对于提示词的选取,以及对于相关这个参数的调整,都能体现出原告所要体现的这个创作个性。

笔者注:随机种子数,一种算法启动密钥。类似哈希数值的计算,存在其唯一性。

4、关于涉案图片的独创性

(1)原告通过SD软件创作生成图片,通过小红书发布后,众多平台用户进行了浏览、点赞和评论,能够体现出原告作品获得了社会公众的认可,是具有独创性,符合我国著作权法对作品创作高度的要求。

(2)SD软件创作过程中,完全由创作者选择参数,选择模型,并且根据自己的喜好来调整不同的参数,不同的调整生成不同的结果。创造活动完全由使用者来完成,属于人类智力活动的成果,同时,创作完成的内容达到了一定的高度,能够固定并以有形的形式表达出来,符合作品特征。

(3)人类文明的发展,是不断利用工具、发明工具,在工具基础上进行各种创造活动的过程,不能因为工具自动化而否定人的创造活动。如果类比照相机,早期相机的光圈、光速均是由人进行调整,随着技术的发展,目前全自动模式等参数都不用自己调整了,完全由电脑控制。当摄影的时候,操控者可能进行一个取景构图,而构图本身实际上没有达到高度复杂的创造性,但即使该情况下,我们没有否认用全自动相机拍摄产出照片的版权,同理,全自动AI生成的照片也仍然是作品。

原告认为,AI工具创作的图画,属于作品的一种,其与电脑上使用Photoshop绘画没有本质区别,应属于美术作品,如果法院不支持的话,也应认定为构成著作权法当中规定的其他作品。

法院询问:

1、被告提到,通过本案模型生成的不同参数的图片,人物的形象都是相似的,长相可能是近似的,原告这边尝试过其他参数,有其他的生成结果吗?

原告答:

人物肖像肯定不是近似的,之所以展示过程中,法庭看到的结果说生成图肖像相对比较近似,是因为我们对人物的肖像进行了严格的关键词控制。因为我们输入了很多关键词,进行皮肤、眼睛、眼型、发色等限定,所以最后看到的结果有一定的相似度。如果没有上述参数条件设定的话,其实可以生成不同的人物肖像。

2、现有的参数设定条件里,对于生成照片人物的动作、姿态是否有限定?

原告答:

这个没有特别要求。因为原告需要的是一幅半身照,主要展现的是上半身,其他动作就算存在,没有办法展现到屏幕里面。目前SD软件其实提供了相关动作设置的功能,假如我希望展现全身的照片,可以在SD软件中进行设置。但是坦率而言,动作设置存在一定问题,很多时候,生成的人物动作是变形或者不协调的,所以原告会主动减少,生成这方面的内容。

笔者注:一种脸型,一类套图。

关于第二个争议焦点,原告是否享有涉案图片的权利?

原告:

1、SD软件、绘画模型未限制最终用户的相关权利。

原告提交了SD软件MIT协议、绘画模型用户协议。MIT协议中开源软件提供方,授予使用者和用户有相应的著作权,同时不对生成结果主张权利。绘画模型用户协议,也同样声明开发者对于用户所生成的相关内容不主张权利。

2、AI绘画工具生成的内容,应属于用户。

就AI绘画工具开发者而言,其开发、设置的本身主观意愿,希望说人工智能的特定功能,能够实现产出绘画结果,但其本身没有利用软件收费获取其他相应的收益。对于用户来说,整个绘图生成过程,由用户选择模型,输入提示词,最终生成能够体现用户自己个性的作品。若把上述产出内容授权于用户,用户有更强的使用软件生成作品并传播作品的动力,更利于相应作品进行使用收益、投资,进入良性循环。

3、用户主动介入了生成的结果。

相关生成过程中,用户并非被动等待自动生成的结果,而是主动介入了生成结果。生成结果就是触发条件、主题类型、语料、风格,所有结果均由原告所进行决定,并由原告作为用户操作所产生。

4、AI生成新内容的归属。

原始的绘画模型,对于AI图片生成创作的底层上,确实起到了一定的作用。但是绘画模型与最终完成的创作结果之间,二者产生了巨大的变化。如果说,模型存在版权,那么原告其实在此基础上进行了改编。对于改编也好,或者说基础创作也好,既然生成了新的作品,新的作品存在权利的话,应该归属于在此过程中的创作者。

笔者注:从绘画模型到生成的图片,巨大的变化,改编。。。

法庭询问:

1、涉案人工智能这个模型的技术原理,请原告向法庭简要说明一下。

原告回答:

根据原告的理解,涉案的 AI 绘画的这个过程为:

(1)AI 绘画在训练的过程中,其实是向 AI 提供了一幅绘画作品的本身,然后对绘画作品进行马打马赛克的方式,然后要求 AI 去进行学习和复原。一开始他的打的马赛克的像素非常高,可能说比如说 30x30 像素,然后让 AI 再去学习和复原。

(2)AI 学习和复原完成之后,便会对马赛克所代表的潜在含义有所理解,在此之后像素逐步缩小,直到最后,由软件提供给 AI 本身去学习的,会变为日常看电视机屏幕上没有信号时候的那种雪花,整个一个雪花屏幕,像素非常小。然后让 AI 去猜测去复原画面本身,那这是它整个的一个训练过程,在训练过程之后完成了相应的算法。

(3)由AI去还原马赛克图形,并不能是凭空的还原,而是依据用户所选择的绘画模型去进行还原。比如说用户提供给AI的绘画模型是一个只有写实照片的模型,那么即使用户要求AI生成卡通风格的绘图作品,也无法实现。所以说很大程度上绘画模型决定了溯源本身所依赖的素材。而在产出图片的过程中,作为用户,可以通过输入关键词的方式,引导AI去理解他所谓的这些画面的主体素材应该是什么。

(4)比如当用户输入指令为“一个女孩”,或者是输入指令为“一个男孩”,然后背景是在一个沙滩或者是在一个海边有棕榈树或者有船,通过用户去输入这些元素, AI 在整个创作的过程中会对这些元素去进行加强。假如用户没有输入提示词,提及这些元素,那么AI可能有一些随机的生成。但是原告在生成过程中,输入了明确的提示词,要求生成怎样的主题、题材作品,依据怎样的提示词会产出比较好的效果,其实都是用户不断的实验、总结,最后进行分享(交流的结果)。

2、被告,市场上存在卖提示词的现象对么?

被告答:

市场上淘宝、拼多多、京东平台都有售卖提示词的,也有售卖生成的AI图片的,价钱十分便宜。有人8元钱购买了关键词,发布了好多高质量的AI图片作品,基本上没有门槛。而且在作品这块,生成的人物几乎都是一模一样的,只要不是故意设置丑陋或者三只手这样,普通人基本上没有什么上手门槛,学习得非常快,绝对不能和画家一样经过基础的训练,学习很长时间才能画出的作品那样具有灵魂。

我认为这个软件就是一个工具,就是一个集合了所有艺术家贡献的工具,而不能说成是操作人的贡献。

关于第三个争议焦点,被诉侵权行为是否构成侵权,以及如果构成侵权,那么侵权责任将如何承担?

原告:

1、被告侵犯了原告作品署名权、信息网络传播权。

(1)小红书平台发布的作品图片,如果下载图片,右下角会自动增加“小红书平台logo”和“发布者ID”的水印。其他用户可以通过小红书平台,查询到原告网络署名id,该署名系现实世界中第二身份,所以原告认为小红书平台的账号、账号署名构成原告署名权。

(2)而被告使用过程中,截去了图片上小红书平台水印和发布者ID,转而将相关作品发布于百家号上,可以通过信息网络供用户在选定时间、选定地点进行获取,构成信息网络传播权的侵权。

2、5000元赔偿由原告学习成本、智力劳动、作品美感、网络用户评价综合考虑而提出。

原告主张的5000元赔偿,是法定赔偿。基于法定赔偿,原告认为案件中涉案图片存在原告本身关于AI软件的学习成本、为涉案作品创作付出的智力劳动、涉案作品最终体现出的美感、受到用户喜爱的程度,因此综合考虑提出,主张的5000元经济损失应获得支持。

3、关于市场上存在AI提示词、AI绘画作品售卖的回应。

(1)我们注意到被告在陈述,称现有网络平台上有一些相关的 AI 绘画作品,或者是一些这个提示词的交易的情况,我们认为首先,这个和本案中原告作品的关联性不强,其次存在交易的情况,更能说明目前对于 AI 或 AI 所绘制完成的这个作品,其实是有很强烈的一个保护需求和使用的需要。

(2)同时也如原告所陈述,SD软件怎么去学习,如何去生成这样的结果,需要很高的学习成本,有需求就有价值,就说明这样的创作并不是一般人随便就能掌握的,之所以有人可以去卖生成的图片、关键词,是因为他觉得我生成的东西付出了足够多的劳动,它是有相关的经济价值的。用户之所以去买是因为他自己没有这样的创作能力,或者说他自己达不到那种艺术的创作水平,找不到一个能够表现一种美好图片、美好的作品的关键的参数和这种风格的参数。

(3)被告的自媒体是做古诗词的,她对文学、艺术有一定的造诣和欣赏水平,之所以能够选择涉案作品,其实客观来讲对这个涉案作品给出了一定的评价,因此对于有价值作品的使用而言,被告应该提高她的注意力,并适当给予赔偿。

笔者注:第三方利用信息差,获取市场收益的行为,不能与AI作品创作、创作的艺术高度等同。事实上,通过市场用户额头流汗工作般,反复试炼并筛选而出的关键提词、参数数值,可以做到直接的套用、重复并多次、快速、便捷的批量生成图片。

最后

买了新硬盘,装个SD软件跑一下。

More from this blog

游戏公司账户涉诈解冻处理流程

前言 游戏公司用于玩家充值的收款账户,容易被不法分子用作跑分的平台工具,导致易被异地公安冻结。 笔者就游戏公司银行账户涉嫌电信诈骗、冻结止付,如何联系、处理解冻等事项内容梳理如下。 需注意,相关内容随着政策处理变化更迭,以下内容均由互联网搜集得来,均为个人见解,仅供部分参考,不代表任何意见指南,亦不代表可行的操作指引。 一、相关名词解释 一级账户:受骗人直接汇入资金的账户,通常为游戏公司收款账户。

Apr 23, 20261 min read
游戏公司账户涉诈解冻处理流程

庭审笔记09 | 搜索引擎关键词贴靠侵权案

原告一:D公司 原告二:D公司关联公司 被告一:Z1公司 被告二:Z2公司 第三人:平台方T 原告D公司及关联公司与被告Z1公司、Z2公司、平台方T商标侵权及不正当竞争纠纷⼀案。 一、原告诉请 原告诉求: 1、二被告立即停止侵害D公司现有的“D公司游戏”注册商标专用权; 2、二被告立即停止不正当竞争行为,包括但不限于停止在第三人平台方T使用“D公司游戏”等一系列关键词,推广被告发行的网络游戏《Z公

Mar 26, 20261 min read
庭审笔记09 | 搜索引擎关键词贴靠侵权案

庭审笔记08 | 游戏公会拉人侵权案

▍前言 公会拉人行为,是游戏中常见的现象。公会组织通常由有竞争关系的竞品游戏运营方直接雇佣。公会组织在游戏内注册使用大量个人账号添加玩家微信,通过“交朋友”、“一起玩”、“发放优惠礼包”等方式,将有消费能力的游戏玩家迁移至另一竞品。 此类事件,较难通过表面证据,证明游戏公会与竞品游戏之间存在雇佣关系,因此,前期往往表现为两家游戏公司商务间的沟通与攻防。 本案判决书中针对公会拉人行为进行了说理和定性,后续原告亦发起了同类型案件,同样得到了法院的支持。通过本案,查阅原告罗列的证据,对于了解该业务模式...

Aug 20, 20251 min read
庭审笔记08 | 游戏公会拉人侵权案

picgo+typora | 一种多平台发布图文的解决方案

▍前言 当一份文本文档,文字间夹杂着大量本地图片,同时该图文需要多平台上传发布时,使用markdown统一格式文本,并自建图床,是一种较好的解决方式。 以下为笔者使用的解决方案分享。 ▍一、markdown文档的易用性 markdown格式,代表了一类简洁、易用的文本输出格式标准。 回溯法律文章的输出场景,除涉及到大量纯文字的文本外,其他无外乎大、小标题、文本加粗、下划线、倾斜格式,除此外,并无更多格式标识需求场景。 普通的文本文字,在markdown中被统一了字号、行间距。其他简单的文本格式,...

Apr 10, 20251 min read
picgo+typora | 一种多平台发布图文的解决方案

庭审笔记07 | 游戏模拟器侵权案

▍前言 本案系较新颖的知识产权侵权案件类型,某战略类SLG的A游戏,其武将立绘(被改为简笔画风格)和技能属性,被模拟器进行了挪用,模拟器已申请了计算机软件著作权,通过自身编译的推算算法,模拟器可以近乎还原A游戏武将阵容沙盘演练结果,以供A游戏玩家在游戏中进行更好的阵容搭配。 大部分内容应已在庭前会议中解决,本次庭审中,法院围绕以下问题进行了总结和宣判: 1、著作权侵权方面,技能描述、技能属性数值、改为简笔画对照的美术立绘是否受到保护。 2、不正当竞争方面,挪用武将数值为玩家提供游戏推演服务并进行...

Apr 3, 20251 min read
庭审笔记07 | 游戏模拟器侵权案

打铁LEGAL

37 posts

A lawyer from China Canton, this blog is about Internet law stuff and tools using methods, with a blogging time and output we could get more.