研究发现,人工智能聊天机器人在创造性思维测试中表现出色

AI伦理与社会1年前 (2023)发布 yundic
182 0 0

挪威斯塔万格大学进行的一项研究显示,人工智能大语言模型(LLM)在测试创造性思维的测试中表现优于人类。

研究人员让256名人类志愿者与三个人工智能聊天机器人ChatGPT3、ChatGPT4和Copy.AI(基于GPT-3)进行对比,以生成绳子、盒子、铅笔和蜡烛等日常物品的替代用途。

这项研究通过由心理学家J.P. Guilford在1967年开发的交替使用任务(AUT)来测量发散性思维。

这个想法是让参与者在一段时间内设计尽可能多的简单对象的用途。例如,回形针可以用作开锁工具或雕刻工具。

人工智能在这项任务中的表现通常优于人类。该研究的作者西蒙·格拉西尼说:“事实上,这是人工智能聊天机器人所展示的一种非凡的能力。”“研究结果表明,人工智能在创造性思维方面比大多数人类都要强。”

人类和人工智能参与者都遵循相同的指令,强调创意质量比创意数量更重要。

使用四种不同的对象提示对聊天机器人进行了11次测试。进行了一些调整,将聊天机器人产生的想法数量与人类参与者产生的想法数量相等。

尽管聊天机器人在发散思维任务中的平均得分更高,但研究也注意到,最具创新性的人类产生的想法与人工智能聊天机器人的想法不相上下,甚至超过了它们。

“我们的研究结果表明,至少目前,最好的人类仍然优于人工智能,”Grassini补充道。

这很有启发性–人类可以产生真正的质量,但没有你最可能预期的人工智能那么快。

研究发表在《自然》杂志上的文章强调,在语义距离和创造力等类别上,人工智能产生的反应得分高于人类反应。

然而,在最佳个体反应的八个评分类别中,人类仍然在七个类别中胜过聊天机器人。

“我知道聊天机器人会表现得很好,但我认为它的表现甚至比我预期的要好,”Grassini说。

尽管研究结果令人鼓舞,但研究人员强调,人类创造力的独特复杂性可能对人工智能完全复制或超越具有挑战性。

Grassini总结道:“人工智能的这些能力是否会直接在人工智能系统上转化,取代需要创造性思维的人类工作,还有待确定。我更倾向于认为人工智能将帮助人类提高能力。

更多关于这项研究的信息

该研究表明,人工智能可以采取新颖和创新的方法来创造性地回答问题。

虽然最好的反应仍然是人类起源的,但人类更容易受到注意力的波动和其他因素的影响,这些因素阻止了他们实现人工智能生成的反应的广度。

它的工作原理如下:

  • 方法论:这项研究使用了交替使用任务(AUT),这是一项历史悠久的测试,肯定会测试发散思维和创造力。参与者包括256名人类和3个先进的人工智能聊天机器人。他们被要求想出日常物品的不寻常和创造性的用途,并根据它们的原创性和有用性来评估人类和人工智能的反应。
  • 性能比较平均而言,人工智能聊天机器人在平均和最大创造力得分方面都优于人类参与者。然而,表现最好的人类仍然可以达到或超过人工智能聊天机器人的创造力水平。
  • AI与人类的区别该研究表明,人类参与者往往表现不佳,因为在任务中途失去注意力。相反,人工智能执行任务时不会感到疲劳,有助于整体更高的性能。
  • 人工智能和人类创造力的优势和劣势该研究认为,人工智能能够获得更多的计算资源,解释了它们的高平均性能。他们基本上可以计算出物体更合理的替代用途,从而更有可能挑出最不寻常的用途。
  • 局限性和未来方向:这项研究承认存在局限性,例如人类参与者缺乏人口多样性。此外,它只使用了一次中老年创造力测试,这自然是范围有限的。

研究人员正在创造新的方法来比较人工智能和人类对测试、问题和其他任务的方法。

最近的一项研究发现,ChatGPT优于学生, 32名受试者中有9人 —相当可靠,但对人类来说可能是个好消息。

我们离全面击败我们的技术还有一代人工智能。

© 版权声明

相关文章

暂无评论

暂无评论...