OpenAI称作者的版权指控是毫无根据的

AI最新政策1年前 (2023)发布 yundic
180 0 0

OpenAI回应了多位作者对其提起的两起几乎相同的集体诉讼,并认为大部分指控应该被驳回。

作者声称,当公司将他们的作品用作ChatGPT的培训数据时,他们的版权受到了侵犯。诉讼中的指控是:

  • 直接版权侵权
  • 代为侵权
  • 版权管理信息删除(DMCA)
  • 不正当竞争
  • 不当得利
  • 疏忽

OpenAI表示,它很高兴第一项指控在法庭上进行辩论,但其余五项在法律上是错误的,应该被驳回。

原告声称,因为他们的书被用来培训ChatGPT,所以ChatGPT输出的一切都是他们受版权保护的作品的衍生品。

OpenAI表示,它既不会证实也不会否认这些有问题的书籍构成了培训数据集的一部分。但它说,即使这些书包括在数据集中,它也只是海量数据中的一小部分。

OpenAI认为这属于公平使用原则,不侵犯版权。

提交人可能很难说服法庭相信他们的论点。他们并不认为ChatGPT正在写与他们相似的书,并与他们竞争。他们说ChatGPT发布的每一个词都是侵犯版权的行为。

ChatGPT在驳回OpenAI的动议中说:“根据投诉,ChatGPT的每一次输出–从对一个问题的简单回答(例如,‘是’),到美国总统的名字,再到描述荷马的《伊利亚特》的情节、主题和意义的段落–都必然是原告书籍的侵权‘衍生作品’。”

这一点很难辩驳。就连ChatGPT对相关书籍的准确摘要也在动议中被描述为类似于“读书报告或评论”,而不是试图从受版权保护的作品中获利。

其余论点的细节可以阅读 OpenAI动议驳回.

为什么OpenAI不要求驳回整个案件?

OpenAI的动议表示,它并不是要求驳回直接侵犯版权的指控,“OpenAI将寻求在案件的晚些时候作为法律问题解决这一指控。”

OpenAI和Meta还没有透露他们使用了哪些数据来训练他们的模型,但几乎可以肯定的是,其中包括大量受版权保护的材料,包括提交诉讼的作者的书籍。

如果包括版权保护的数据,那么OpenAI肯定意识到了这一点。该公司将辩称,访问这些材料的意图不是为了制作衍生作品,并在与原件竞争中从中获利。

如果法院同意,那么该决定将开创一个先例,将在许多其他正在进行的人工智能相关诉讼中得到依赖。

对它有利的决定将意味着它不会因为过去使用受版权保护的数据而被起诉,它可以继续这样做来训练它的新模式。如果法院裁定人工智能培训属于合理使用原则,那么对其他人工智能公司来说,这也将是开放季。

这是一个有风险的举动,但在某个时候,这个问题将不得不解决。如果这一决定不利于OpenAI,那么它将不得不放弃ChatGPT,并从零开始训练它。这一次使用的数据集要小得多。

© 版权声明

相关文章

暂无评论

暂无评论...