艺术家和AI图像生成器之间的战斗

32 0 0

艺术家和创作者正在就潜在的版权侵权问题向人工智能开发人员发起挑战。

在人工智能图像生成器中输入一个提示，如DALL—E、MidJourney或Stable Diffusion，它会在几秒钟内生成一个看似独特的图像。

尽管它们显然是独一无二的，这些图像是由数十亿张其他图像通过可以被描述为复杂的数字拼贴技术生成的。

这些图片都是从“公共”或“开放”的资源中获取的。

如果你问ChatGPT像DALL—E这样的图像生成器是如何工作的，它会说，“把DALL—E想象成一个超级先进的数字艺术家，他已经看过数百万张图像，并可以根据你的描述画出一张新的图像，试图使其尽可能准确。它是通过混合和匹配从以前的观察中学到的元素来实现这一点的。'”

这有点像漫游世界各地的艺术画廊，并拍摄每一件作品的照片—除了你不能被踢出去。

互联网上没有保安和摄像头监控人们，以防止盗版或盗窃，而数据窃取的做法–即通过机器人的服务从互联网上收集数据–一直占据着模糊的法律领域。

艺术家们认为，在公共数据集上训练文本到图像的人工智能相当于世界上最大的艺术抢劫。

AI探测器给艺术家带来了什么感觉？

对于一些成功的艺术家来说，他们的作品被复制了数千次，甚至数百万次-人工智能生成的艺术的影响使得他们很难区分自己的作品和人工智能的复制品。

美学上的差异太小了，可能是因为流行的图像在数据集中出现了大量。

格雷格·鲁托夫斯基（Greg Rutowski）说：“我的作品在人工智能中的应用超过了毕加索。

Greg Rutowski的作品被复制了数千次：资料来源：麻省理工学院。

Rutoki的幻想插图功能在专营权，如龙与地下城和魔术：聚会，可以复制通过文本到图像生成器，只需添加艺术家的名字，以提示符，”以格雷格·鲁托夫斯基的风格创造一条龙与食人魔战斗。”

他告诉bbc“在我发现它的第一个月，我意识到它将明显影响我的职业生涯，我将无法在互联网上识别和找到我自己的作品，”他补充道，“结果将与我的名字联系在一起，但不会是我的形象。”它不会是我创造的。所以这会让那些发现我的作品的人更加困惑。

他继续说：“我们这么多年来一直在努力的所有东西都被人工智能轻易夺走了。

最后一句话真的切中了目标，因为人工智能复制复杂、有才华的作品只需几秒钟，这意味着艺术家的作品不仅变得多余，而且用于创作它们的技能也会丢失。

人性的L缺乏真正的技能和知识是人工智能最紧迫的风险之一，被称为“衰弱”，迪斯尼电影《WALL—E》中的描述是，人类由于技术而失去了行动能力。

另一位谈到人工智能复制他们作品的艺术家是Kelly McKernan，她是田纳西州的插画家，她发现她的50多件作品被列为大规模人工智能开放网络（LAION）的训练数据。

您可以使用该工具搜索人工智能训练集中的约58亿张图像。我受过训练吗？“这就是麦科南偶然发现她的作品的原因。

我受过训练吗？提供了一个搜索开源图像数据库的工具。

LAION是一个创建开源模型和数据集的非营利性组织，其中许多已被用于训练备受瞩目的文本到图像模型，包括稳定扩散和图像。

“突然之间，所有这些我有个人关系和旅行的绘画都有了新的意义，它改变了我与这些艺术品的关系，”McKernan说。

法律诉讼正在进行中

麦科南与其他艺术家萨拉·安德森和卡拉·奥尔蒂斯一起，对Sta-bility AI、DeviantArt和Midjourney采取了法律行动。

他们的诉讼加入了作家和视觉艺术家对人工智能公司采取法律行动的浪潮中。

更大的公司也在起诉或计划起诉AI开发者，包括Getty Images，他们声称Stability AI未经许可非法复制和处理了1200万张图像。

麦科南说：“事实上，版权只适用于我的完整图像。我希望它(诉讼)鼓励对艺术家的保护，这样人工智能就不会被用来取代我们。如果我们赢了，我希望很多艺术家都能拿到钱。这是免费的劳动力，有些人从剥削中获利。

McKernan的风格，见下文，已被要求在大约12，000中途提示。

在Instagram上查看此帖子

Kelly McKernan分享的帖子（@ kelly_mckernan）

这里的一个根本问题是，版权法根本不是为人工智能时代而建立的。

表演艺术和娱乐联盟Equity的Liam Budd主张更新法律，以反映生成人工智能提供的潜在商机。

他表示我们需要在法律上更加明确，并正在为更新版权法而奔走。

为了应对日益高涨的人工智能版权侵权浪潮，欧盟等多个司法管辖区建议人工智能开发人员披露用于培训的任何受版权保护的材料。

够了吗？人工智能开发人员是否已经表明他们可能会逃脱惩罚？

毕竟，这些数据集中的大多数已经组装好了，人工智能公司可能会辩称，他们只是在更新模型，以规避声明版权材料的需要。

这些诉讼有坚实的法律基础吗？

这一轮集体诉讼主要围绕两个论点。

第一，声称这些公司未经许可使用艺术家的作品侵犯了艺术家的版权。
第二，人工智能输出基本上是衍生内容，因为它们包含在训练数据中。

这些论点的适用范围在世界各地不同，例如在美国，美国的“合理使用”法律通常比欧盟更宽松。这进一步加剧了人工智能版权格局的复杂化。例如，如果公司在英国经营，他们可能会发现争论“合理使用”更具挑战性。

此外，生成人工智能公司正在被起诉，而不是编译数据集的实体，如MidJourney案件中的LAION。尼克松·皮博迪律师事务所的知识产权律师埃利亚娜·托雷斯指出，如果LAION创建了数据集，那么被指控的侵权行为就发生在那个时间点，而不是当数据集被用来训练模型时。

然后，证明人工智能生成的作品是原始作品的复制品是一个挑战，因为人工智能的复杂性质，使用算法处理来分解和重新组装图像。

监管机构对生成人工智能的法律影响措手不及，虽然正在开发自动过滤器和艺术家选择退出条款等临时解决方案，但它们可能还不够。

在法官对个别案件做出判决之前（这可能需要数月时间），生成人工智能公司正在许多司法管辖区面临重大法律风险。

历史表明，版权法可以调整以适应新技术，但在达成共识之前，艺术家和人工智能开发者都非常不知情。

法官们在诉讼中设置了阻尼器

到目前为止，评委们没有给艺术家们什么值得乐观的。

例如，美国地区法官威廉·奥里克（William Orrick）对凯利·麦肯南（Kelly McKernan）的诉讼表示怀疑。

根据奥里克法官的说法，McKernan和其他原告需要“提供更多的事实”，关于涉嫌侵犯版权的指控，并明确区分他们对每家公司的索赔要求（Sta Cubbil Arbitity AI，DeviantArt和Mid Jour Danney）。

奥里克指出，这些系统已经在“50亿个压缩图像”上进行了训练，因此艺术家必须提供更有力的证据，证明他们的作品具体涉及涉嫌侵犯版权。一追踪这起诉讼的网站最近上传了关于这些模型如何工作的技术信息，通过插值训练集中的图像内容。

该案由约瑟夫·萨维里律师事务所代理，该律师事务所还代理至少另外5起针对人工智能公司的类似案件。

同样，版权可能会侵犯数据收集而不是生成数据。

美国《数字千年版权法》第1202（b）条“是关于作品的相同‘复制品’，而不是关于零散的片段和改编”，认为作品被人工智能模型的过程‘复制’是潜在的脆弱性。

Orrick的观点也引发了对MidJourney和DeviantArt等公司责任的质疑，这些公司将Stability AI的Stable Diffusion技术整合到自己的生成AI系统中。

我f人工智能开发者，如OpenAI、Meta等，他们被赋予了侵犯艺术家版权的责任，他们很容易受到进一步的法律诉讼。

作家和作家也在提起诉讼。

在另一近期诉讼美国喜剧演员兼作家Sarah Silverman和作家Christopher Golden和Richard Kadrey声称他们的言论被非法用于训练ChatGPT和LLaMA等人工智能模型。

该诉讼对视觉艺术家提出的索赔提出了平行要求，但这一次，人工智能是基于公共文本数据进行训练的。

该诉讼声称，ChatGPT能够准确地总结西尔弗曼的《尿床》、戈尔登的《Ararat》和Kadrey的《桑德曼苗条》等书籍。关键的是，摘要提供的详细程度不能用维基百科或书店网站上上传的书籍摘录来解释。

原告指控OpenAI和Meta在未经同意的情况下使用来自“影子图书馆”的受版权保护的图书。

影子图书馆，如Bibliotik、Library Genesis和Z-Library，存放着大量非法复制的信息。

创世纪图书馆以前曾面临过法律诉讼，并被告知关闭他们的网站，但组织者只是打开了新的域名。资料来源：维基百科。

虽然人工智能公司显然已经在版权作品的帮助下将产品货币化，但它们有几层保护，包括其模型固有的复杂性，以及它们在道德、伦理和法律领域中占据的特殊空间。

法院必须做出什么裁决？

尽管监管机构仍在审议围绕人工智能的规则，但法官可能首先倾向于塑造未来的版权格局。

这可能结果是，由于每个案件的具体情况和所裁决的司法管辖区，立法拼凑而成。

目前，有许多问题需要回答，包括：

Q1：在受版权保护的材料上训练模特是否需要许可证？

合理使用与许可：法院可能必须决定在培训期间临时复制数据是否属于”合理使用”范围，这将允许在没有许可证的情况下使用。这可能取决于复制的目的、受版权保护的作品的性质、所使用部分的数量和实质性以及对受版权保护作品市场价值的影响等因素。
国际视野：不同的司法管辖区在这一问题上可能有不同的立场。例如，欧盟的版权指令可能与美国版权法不同。

Q2：生成性人工智能输出是否侵犯了模型训练材料的版权？