作者Mona Awad和Paul Tremblay对ChatGPT的创建者OpenAI提起诉讼。
《看胖女孩的13种方法》的作者莫娜·阿瓦德和《世界尽头的小屋》的作者保罗·特伦布莱声称,人工智能平台在未经同意的情况下就他们的作品对其模型进行培训,侵犯了他们的版权。
ChatGPT接受了来自互联网的公开数据的培训。然而,根据Awad和Tremblay的说法,他们的受版权保护的小说被非法用于培训ChatGPT,正如诉讼文件中所述,这一怀疑是因为ChatGPT能够为他们的书籍生成“非常准确的摘要”。
作者认为,当他们要求ChatGPT提供他们小说的摘要时,人工智能返回的信息并不是显然 公开可用。虽然ChatGPT可以从维基百科等网站上发布的摘要中学习,但这些摘要并没有提供足够的细节来证明AI摘要的深度。原告 提供展品 来证明这一点
苏塞克斯大学知识产权法的读者Andres Guadamuz说,这是第一次针对OpenAI涉及版权问题的此类案件。
话虽如此,这是针对OpenAI的一长串法律案件中的下一个案件,尽管大多数案件都是诽谤案件。
此外,在图像生成领域已经发生了几起版权案件,其中包括盖蒂图片公司,该公司提出了一个 针对稳定AI的诉讼 使用它的图像而没有补偿。
AI使用“影子库”
Saveri和Butterick声称OpenAI在其训练数据方面变得“越来越保密”,这可能是一个公平的评论。在ChatGPT的早期开发阶段,OpenAI透露它使用了一个大型的“基于互联网的图书语料库”进行训练,称为“Books2”。
鉴于数据集中估计有294,000本书,律师怀疑OpenAI的书籍来源于Library Genesis(LibGen)和Z—Library等“影子图书馆”。所谓的影子图书馆是书籍和学术论文的数字仓库。
虽然主要用于学术用途,但大多数都包含非法复制的书籍。
关于影子图书馆的各种法律问题,人们几乎没有达成共识–它们已经成为互联网家具的一部分。
这个起诉书说这些公然非法的影子图书馆长期以来一直是人工智能培训界的兴趣所在。
中 《卫报》报道纽卡斯尔大学(Newcastle University)法律、创新和社会教授莉莉安·爱德华兹(Lilian Edwards)表示,这一特殊案件可能取决于法院是否认为使用受版权保护的材料进行人工智能培训是“合理使用”。国际上对公平使用的定义各不相同,这使问题更加复杂。
成功的几率?可能很小,但法律压力正在向各行各业的人工智能公司增加。
即将出台的人工智能法规,如《欧盟人工智能法案》,将强制执行透明度指导方针,要求开发人员发布他们的训练数据。