纽约时报谴责OpenAI,微软对版权索赔

AI行业新闻9个月前发布 yundic
57 0 0

《纽约时报》(NYT)今天对OpenAI和微软提起诉讼,声称这些公司通过使用其内容训练他们的人工智能模型,侵犯了其版权。

微软和OpenAI都不愿证实到底是什么数据被用来训练他们的模型,但越来越明显的是,这些数据几乎是互联网上可用的任何数据。

今年4月,《纽约时报》接洽了微软和OpenAI,讨论了它对其内容如何使用的担忧。法律文件指出,尽管做出了这些努力,但他们无法达成决议。今年8月,他们表示正在考虑提起诉讼,现在他们终于做到了。

文件称,OpenAI和微软在《纽约时报》内容方面培训的人工智能模型“剥夺了时报的订阅、许可、广告和附属收入。”

当用户向ChatGPT或Copilot询问有关《纽约时报》报道的内容的问题时,诉讼声称这些模型“生成的输出可以逐字背诵《纽约时报》内容,详细总结,并模仿其表达风格”,而且通常没有原始文章的链接。

当用户在ChatGPT上获得答案而没有点击《泰晤士报》网站时,该公司损失了广告和订阅收入。

该媒体公司还拥有Wirecutter等评论网站。《纽约时报》声称,评论内容经常被人工智能聊天机器人复制,而转介链接被删除。这剥夺了《泰晤士报》的附属推荐收入。

该诉讼还声称,像ChatGPT这样的人工智能模型必须产生幻觉的倾向损害了其声誉。有时候,事实上错误的反应是模特产生的幻觉的结果,但仍然归因于《泰晤士报》。

但它有复制吗?

目前,大型人工智能公司似乎都在卷入版权诉讼。OpenAI、Meta、微软、Stable Diffusion等公司目前正在参与来自作者、艺术家和其他创意者的诉讼。

被告的总体论点是,人工智能模型不会复制他们接受培训的数据,使用受版权保护的数据进行培训符合公平使用原则。

《纽约时报》诉讼中的例子使这一点很难得到论证。下面是一个ChatGPT交互的示例,它逐字复制了The Times的内容。

纽约时报谴责OpenAI,微软对版权索赔

ChatGPT逐字复制NYT内容。来源:ChatGPT

该法律文件包含多个ChatGPT和Bing Chat/Copilot逐字引用文章的例子。

这其中有什么利害关系?

《纽约时报》的诉讼没有提到具体数字,但表示微软和OpenAI应该“对非法复制和使用《纽约时报》独特有价值的作品所欠的数十亿美元的法定和实际损失负责”。

它还说,除了停止进一步使用NYT内容,“所有包含Times Works的GPT或其他LLM模型和培训集”都应该被销毁。

如果这起诉讼针对OpenAI和微软,它将开创一个先例,几乎肯定会看到其他媒体出版商与他们的律师排队。

这些公司将需要放弃他们的模式,并从头开始重新培训他们,但这一次没有令人不快的内容。

对于新闻业来说,高质量报道的可持续性岌岌可危。如果他们输掉了官司,像时报这样的新闻出版商如何资助记者撰写往往需要数百个小时才能撰写的文章?

这两种前景都不具吸引力。本月早些时候,OpenAI与新闻出版商阿克塞尔·斯普林格(Axel Springer)达成了一项许可协议,在ChatGPT响应中包含其新闻内容。由人工智能生成和传递我们的新闻似乎是不可避免的。

许多未能从印刷版转向在线版的报纸已经不复存在。《纽约时报》成功地实现了这一转变。在人工智能时代,这家新闻出版商和其他人将如何管理新闻业的下一阶段?

让我们希望我们能够保留我们的人工智能模型和人类记者。

© 版权声明

相关文章

暂无评论

暂无评论...