Google:允许人工智能挖掘数据,除非出版商选择退出

AI伦理与社会1年前 (2023)发布 yundic
271 0 0

在向澳大利亚正在进行的人工智能监管框架审查提交的文件中,谷歌要求对人工智能训练数据实施更宽松的版权法。

在过去的几个月里,澳大利亚加快了监管人工智能在其境内的使用的步伐。该公司于6月开始对人工智能监管框架进行审查,其中一个讨论点是如何使用在线数据来训练人工智能模型。

谷歌长期以来一直支持“合理使用”的方法,而不是更严格的版权法,这将完全阻止人工智能数据抓取器。合理使用的一个例子是谷歌如何抓取互联网以提供有效的搜索结果。

谷歌的网络爬虫复制网站的一些内容,然后在搜索结果中显示出来。在大多数情况下,没有人认为这是侵犯版权。如果你不希望Google抓取你的网站,你可以阻止它的网络爬虫。

在提交给澳大利亚当局的报告中,谷歌建议,除非出版商积极选择退出,否则应允许像谷歌这样的公司收集已发表的材料,以培训其人工智能模型。OpenAI在最近发布了它的刮刀GPTbot后,也将感兴趣地关注这一讨论。

7月的博客文章谷歌建议出版商或许可以使用一种类似于网站使用其robots.txt文件的方法。这些文件目前包含允许或禁止谷歌爬行其搜索引擎站点的指令。

版权不是这样运作的

不过,谷歌提出的解决方案违反了版权原则。

新南威尔士州法律与司法学院的高级讲师凯琳·曼瓦林博士告诉《卫报》:如果你想复制版权所有者持有的东西,你必须得到他们的同意,而不是一种选择退出的安排…他们的建议是对例外情况的运作方式进行彻底改革。

这就说得通了如果你想复制和使用别人的作品,你需要得到他们的许可。谷歌建议,如果你没有明确告诉他们不要,那么你的数据应该是公平的游戏。

随着各种流派的创意人士谴责具有创造力的人工智能对他们作品的大规模消费,谷歌可能在这个问题上游到了上游。

雪上加霜的是,谷歌目前如何从新闻出版商那里抓取和使用内容。

最终,用户希望拥有有用的人工智能工具,这就要求人工智能模型在大量人工生成的内容上进行训练。找到一个公平的方法来做到这一点并不容易。

© 版权声明

相关文章

暂无评论

暂无评论...