什么,又一个?!
OpenAI和微软又遭遇了另一起诉讼,这一次涉及数字媒体机构Raw Story、AlterNet和The Intercept,原因是它们被控侵犯版权。
这些媒体已经对这家技术二人组采取了法律行动,因为他们在训练他们的人工智能技术时使用了版权内容,要求金钱赔偿,并从人工智能的训练数据集中删除内容。
这是一个熟悉的故事,OpenAI在过去24小时内面临的第二起诉讼,因为埃隆·马斯克正试图 起诉该公司的创始人格雷格·布罗克曼和山姆·奥特曼违反了公司的创始协议。
这起新的版权诉讼声称,ChatGPT在没有必要的信用或引用的情况下接受了受版权保护的新闻培训,要求每一次侵权至少赔偿2500美元。
的 意见书解释,“生成性人工智能(AI)系统和大型语言模型(LLM)是使用人类创造的作品进行训练的。人工智能系统和LLMS吸收了大量的人类创造力,并用它来模仿人类的书写和说话方式。这些培训集包括数十万(如果不是数百万)新闻作品。
它还呼吁, Copyleaks最近的研究根据获奖网站Copyleaks的数据,在Copyleaks进行的一项研究中,被告的GPT—3.5产品提供的回复中,有近60%包含某种形式的抄袭内容,超过45%的回复包含与先前存在的内容相同的文本。
在一份大胆的声明中,Raw Story的首席执行官兼创始人兼AlterNet的所有者约翰·伯恩(John Byrne)阐述了对Big Tech做法的越来越大的挫折感,他说:“现在是新闻机构反击Big Tech不断试图将他人的工作货币化的时候了。大科技已经摧毁了新闻业。现在是出版商采取立场的时候了。”
与其他诉讼一样,这里的主要问题是,像OpenAI这样的人工智能公司对他们的模型进行了培训,他们认为大量数据是“开源”的,“在公共领域”,或“合理使用”。
问题是,这些概念非常模糊。版权法本身并没有考虑到人工智能模型培训。
OpenAI最近回应了《纽约时报》的诉讼,这可能是该公司最引人注目的,声称, 纽约时报付钱给某人 来“破解”他们的产品。
OpenAI辩称,《纽约时报》使用复杂的提示来强制制作侵犯版权的案例。
然而,《纽约时报》回击称,由于人工智能公司不公开他们的训练数据,人们别无选择,只能对产品进行逆向工程以曝光。
随着对生成人工智能公司的压力增加,该行业正接近十字路口。