OpenAI和MidJourney正在寻求购买WordPress和Tumblr数据

AI伦理与社会6个月前发布 yundic
512 0 0

Automattic是WordPress和Tumblr背后的公司,正在讨论与MidJourney和OpenAI的数据和内容交易。

这些信息最初由 404媒体根据Automattic内部一位未透露姓名的消息来源的报道,表明可能即将与OpenAI和中途达成协议。

此前,Tumblr上流传着与MidJourney达成的潜在交易可能会为该平台带来新的收入来源。

404表示,到目前为止,交易过程一直很混乱,包括向OpenAI和MidJourney的部分数据传输失败,用Tumblr的一位产品经理的话说:

“公共博客上的私人帖子,被删除或暂停的博客上的帖子,未回答的问题(通常这些问题在得到回答之前是不公开的),私人回答(这些问题只显示给接收者,而不是公开的),按照我们更现代的标准标记为“明确”/NSFW/“成熟”的帖子(这可能不是什么大事,我不知道)。

此举的影响尚不清楚,交易的进一步细节即将公布。

人工智能训练数据的淘金热上升了一个台阶

就像这样,人工智能训练数据的淘金热已经加快了一个速度。

是的,生成人工智能公司一直需要大量的数据,但他们现在急于为这些数据付费,而不是免费获取。

几天前, 据报道,Reddit讨论了将其大量用户生成的内容授权给一家尚未披露的人工智能公司,这笔交易每年可能价值约6000万美元。这是在Reddit为3月份的公开募股做准备之际出现的,目标是估值接近50亿美元。

这一潜在的许可协议符合科技公司日益增长的趋势,以确保合法的数据使用协议,特别是在面临日益增加的版权风险的情况下。

正在进行的法律斗争,例如纽约时报诉讼,提高了对内容的紧迫性交易.

Automattic与人工智能公司谈判的举动引发了人们对使用用户生成的内容进行人工智能培训的质疑。

据称,他们宣布计划推出一项新功能,允许用户选择不与包括人工智能公司在内的第三方共享数据。

自动化发了 公开声明 在404的报告之后发布的一份声明中,“我们目前默认阻止了主要的人工智能平台爬虫,包括来自最大的科技公司的爬虫,并在新的爬虫发布时更新我们的列表”,并且“将只共享来自未选择退出的网站的www.example.com和Tumblr上托管的公共内容。

它继续说,“我们还在与一些精选的人工智能公司直接合作,只要他们的计划与我们社区关心的东西保持一致:归因、选择退出和控制。”

然而,选择不将您的信息用于人工智能培训可能会对用户的帐户造成惩罚。

一个新发布的FAQ题为“当你选择退出时会发生什么?”声明:“如果您从一开始就选择退出,我们将通过将您的站点添加到禁用列表来阻止爬虫程序访问您的内容。如果您以后改变主意,我们还计划向任何合作伙伴通报新选择退出的人员的最新情况,并要求从过去的来源和未来的培训中删除他们的内容。

我们现在生活的世界里,你在互联网上发布的任何东西都可以被出售用于人工智能培训目的–如果不是免费的话。

随着人工智能的发展,关于数据使用和隐私的争论可能会加剧。

拥有数据金矿的公司将赢得巨大的胜利,但对普通互联网用户来说,代价是什么?

© 版权声明

相关文章

暂无评论

暂无评论...