你会允许Meta使用你的Facebook和Instagram帖子来训练他们的人工智能模型吗?事实是你别无选择。
Meta证实他们使用Facebook和Instagram的数据来训练其新的人工智能助手。
早在8月份,一位发言人就表示,Llama 2没有接受过Meta的数据培训,并表示该模型“没有接受过Meta用户数据的培训,我们还没有在我们的系统上推出任何生成性的人工智能消费者功能。”
随着公司新推出的多平台, 产生式AI助手,它使用Meta从人们的公开帖子和评论中获得的数据。然而,Meta说,他们有意识地避免使用家人和朋友之间共享的私人帖子。
Meta负责全球事务的总裁尼克·克莱格在该公司的年度Connect大会上指出,“我们试图排除那些以个人信息为主的数据集,”他进一步补充说,Meta用于培训的“绝大多数”数据都是公开的。
克莱格举了一个例子,引用LinkedIn作为一个平台,其内容Meta出于隐私考虑故意决定不使用。
像Meta、OpenAI和谷歌这样的科技巨头最近因未经同意使用互联网数据来训练他们的人工智能模型而受到批评。
这些公司现在正在努力解决在其人工智能系统中使用私人或版权内容的决定,并面临着指控他们侵犯版权的作者的法律挑战。包括《权力的游戏》创作者乔治·R·马丁在内的几位知名作家最近加入了针对OpenAI和Meta的大量诉讼。
在Meta的Connect活动上,首席执行官马克·扎克伯格(Mark Zuckerberg)推出了Meta AI。该工具被强调为该公司主要以消费者为中心的人工智能产品之一。与以往的活动不同,今年的焦点主要集中在人工智能上,远离了基本上已经不复存在的虚拟现实和虚拟现实项目。
Meta的AI助手的基础在于一种定制的模型,该模型的灵感来自于Llama 2语言模型,他们在7月份推出了该模型,供公众和商业使用。此外,他们还开发了Emu,这是一种创新的模型,旨在根据文本输入创建视觉效果。
克莱格强调,人工智能培训过程使用了Facebook和Instagram公开帖子中的文本和图像。
Meta的一位代表表示,Emu模型经过专门训练,用于使用这些公开帖子生成图像。
另一方面,聊天功能以Llama 2模型为基础,并补充了一些公开可访问和带注释的数据集。
从安全角度来看,克莱格表示已经采取了具体措施,例如禁止人工智能工具生成公众人物的超逼真图像。在谈到有争议的版权内容时,克莱格表示:“我们认为是,但我强烈怀疑这将在诉讼中发挥作用。
当被问及Meta对复制受版权保护的图像的预防措施时,该公司的一位代表指出了他们更新的服务条款,该条款严格禁止用户创建违反隐私和知识产权规范的内容。