研究发现，人工智能聊天机器人在创造性思维测试中表现出色

182 0 0

挪威斯塔万格大学进行的一项研究显示，人工智能大语言模型(LLM)在测试创造性思维的测试中表现优于人类。

研究人员让256名人类志愿者与三个人工智能聊天机器人ChatGPT3、ChatGPT4和Copy.AI(基于GPT-3)进行对比，以生成绳子、盒子、铅笔和蜡烛等日常物品的替代用途。

这项研究通过由心理学家J.P. Guilford在1967年开发的交替使用任务（AUT）来测量发散性思维。

这个想法是让参与者在一段时间内设计尽可能多的简单对象的用途。例如，回形针可以用作开锁工具或雕刻工具。

人工智能在这项任务中的表现通常优于人类。该研究的作者西蒙·格拉西尼说：“事实上，这是人工智能聊天机器人所展示的一种非凡的能力。”“研究结果表明，人工智能在创造性思维方面比大多数人类都要强。”

人类和人工智能参与者都遵循相同的指令，强调创意质量比创意数量更重要。

使用四种不同的对象提示对聊天机器人进行了11次测试。进行了一些调整，将聊天机器人产生的想法数量与人类参与者产生的想法数量相等。

尽管聊天机器人在发散思维任务中的平均得分更高，但研究也注意到，最具创新性的人类产生的想法与人工智能聊天机器人的想法不相上下，甚至超过了它们。

“我们的研究结果表明，至少目前，最好的人类仍然优于人工智能，”Grassini补充道。

这很有启发性–人类可以产生真正的质量，但没有你最可能预期的人工智能那么快。

的研究发表在《自然》杂志上的文章强调，在语义距离和创造力等类别上，人工智能产生的反应得分高于人类反应。

然而，在最佳个体反应的八个评分类别中，人类仍然在七个类别中胜过聊天机器人。

“我知道聊天机器人会表现得很好，但我认为它的表现甚至比我预期的要好，”Grassini说。

尽管研究结果令人鼓舞，但研究人员强调，人类创造力的独特复杂性可能对人工智能完全复制或超越具有挑战性。

Grassini总结道：“人工智能的这些能力是否会直接在人工智能系统上转化，取代需要创造性思维的人类工作，还有待确定。我更倾向于认为人工智能将帮助人类提高能力。

暂无评论

暂无评论...