《纽约时报》正在考虑对OpenAI采取法律行动,怀疑它为训练ChatGPT而窃取新闻内容。
OpenAI承认,它挖掘了互联网上可免费获取的数据,但并没有披露它使用的数据。该公司没有获得使用这些数据的许可,但围绕人工智能培训的数据抓取的法律尚不清楚。
除了未经许可使用其数据的问题外,《纽约时报》还担心,ChatGPT的回应可能会与自己的内容竞争,此外还会侵犯版权。
如果用户向ChatGPT询问一个有新闻价值的事件,那么回复可能会包含一个基于《纽约时报》最初发表的报道的意译回复。
在ChatGPT(BC?)之前,用户可以在Google输入问题,然后点击进入纽约时报网站,在那里媒体公司可以将其发布的内容货币化。现在,用户可能会得到答案,而不会给创建材料的公司带来任何收入。
如果纽约时报拒绝OpenAI会发生什么?
有很多假设,但如果纽约时报加入了越来越多的其他起诉OpenAI的人的行列,并赢得了诉讼,那么可能会有严重的后果。
联邦版权法规定,如果OpenAI故意侵犯版权,则每次侵权可能面临高达15万美元的罚款。《纽约时报》有一个庞大的档案材料储存库,因此根据法官对“个人侵权”的看法,这可能是一笔公司倒闭的罚款。
联邦版权法还允许破坏侵犯版权的材料。这对OpenAI来说是一个巨大的问题。违规材料是ChatGPT的训练数据集。
如果它被破坏,那么这意味着OpenAI必须从头开始重建ChatGPT。而这一次没有免费获取互联网数据的好处。
其他媒体公司在做什么?
IAC主席巴里·迪勒(Barry Diller)正在领导一个由主要出版商组成的联盟,集体对人工智能公司提起诉讼,以获得他们所说的侵犯版权行为的赔偿。
《纽约时报》与该组织进行了讨论,但随后拒绝加入其联盟。
7月,美联社与OpenAI达成协议,授权其内容可追溯到1985年。该协议承认了双方的利益,因为AP希望在其运营中使用OpenAI的生成AI。
在一份联合声明中,两家公司表示:“这项安排将允许OpenAI授权AP的部分文本存档,而AP将利用OpenAI的技术和产品专业知识。
该协议可能是一个很好的例子,说明出版商和人工智能公司之间的许多问题将如何解决。这个场景可能代表了OpenAI的最佳场景。
但是,随着越来越多的法律纠纷和与主要投资者的紧张关系,OpenAI的情况似乎越来越糟。