前言

如前文，针对AI文生图案，笔者就庭审内容进行了总结陈述。

前文：庭审笔记04 | ai文生图案（上）

通过初步上手SD软件，并查阅相关文章。就SD软件文生图功能的实现和影响图片因素的要点进行总结，陈列如下。

SD文生图原理

针对文生图SD软件，以及庭审中探讨的问题，笔者进行一些个人的观点发散。相关内容均为个人现时当下的见解，不作任何参考意义。

一、制作同一杯咖啡

1、复刻AI图片

理论上，AI图片存在完全还原的可能性：当安装环境一致、挑选模型、咒语、界面参数一致时，任何人启动SD软件，都会生成同样的AI图片。

以相机拍照而言，可以类比这样的场景，当一个相机在风景前，已预设三脚架、角度、参数，你我所需要执行的没有不同，先后按下快门。

或者以做咖啡来类比，同一咖啡机，放入咖啡豆、设定磨豆程度、调整好温度、时间，按下启动，制作出同一杯咖啡。

2、模型是一个黑盒

各类已成型的打包模型，依据前期投喂素材的不同，决定了产出图片的风格。

不同模型，如果操作者初次接触，即便在相同咒语的启动下，其呈现出的产出结果，依然是不可控的。

所以无论SD软件产出的AI图片，距离操作人员心目中实际的场景如何，操作人员依然需要对咒语进行进一步微调，以达到咒语、模型和产出AI图片的强绑定性。

即言之，包装好的模型，可被视为一个黑盒，需要通过调试咒语，反复摸索测试，最终得到稳定的产出和效果。

如此，可固定为一条可稳定输出的咒语。

3、低价的咒语

AI文生图案中，被告提到，通过网络平台，可以以非常低廉价格，轻易获得大量咒语和教程。为此，笔者在某平台上，以极低的价格，购入了相关咒语。

购买商品后，卖家提供了一条网盘链接，链接文件夹内，以excel文档形式，囊括总结了大量SD咒语，表格中，不仅囊括了示意图、关键词、反向关键词、采样方法、采样次数、随机种子等。同时还附加了NovelAI、Midjourney相关类似资料。

不需要懂得任何原理，JUST USE IT。

而根据笔者的尝试，可能是未启用lora插件，选择韩国模特模型的原因，在其他参数输入一致时，产出的AI图片，画风与示意图完全不同。

但可以看出，SD软件在已选定模型的基础下，依然很好的诠释了咒语。

批量的低价咒语，在模型中划出了一个虚拟的边界，为操作者生成AI图片指明了参考方向。

4、咒语的不可版权性

庭审争议焦点，即讨论AI图片，是否构成著作权法下的作品。

首先，从可复制性角度，SD文生图图片，生成为常见的图片格式，符合以有形形式复制的要求。

其次，独创性方面。通过梳理SD生成图片的流程，操作者在其中的参与，一共有三处，分别是：

模型的选择
咒语（Prompt提示词）、界面参数的输入
对生成图片的挑选

模型的选择、界面参数的输入，操作者对已生成图片的挑选，均不具独创性讨论空间。

探讨的点，需回到咒语。

如前所述，咒语+模型=AI图片。

咒语由以下内容组成：

一系列控制参数
正向、反向提示词

此处的参数，指代简单的数值调配，比如迭代步数、采样方法、分辨率等，均由操作人手动勾选。

正向、反向关键词，为单个关键词输入，或者可以称之为标签化。加上Prompt提示语法，调整部分关键词的权重，最终构成一个关键词词组。通过关键词词组，可以构建出，一个简单的画面场景。

以其他博主调试咒语文章举例：

中文场景：一个女孩，银色长发，紫色眼瞳，眼镜，口红，黄色职业装，纤细的身材, 走路，街道背景，看着屏幕

加上场景权重等描绘，构成正面提示词Prompt：

1girl, silver long hair, purple eyes, glasses, lipstick, yellow business_suit, slim body, walking, street_background, looking at viewer,(masterpiece:1. 4, best quality), unity 8k wallpaper, ultra detailed, beautiful and aesthetic, perfect lighting, detailed background, realistic, solo, perfect detailed face, detailed eyes, highly detailed,

最终得到画面：