苏黎世联邦理工学院的研究人员开发了一种机器人系统,可以使用强化学习解决现实世界的迷宫游戏。
详见 他们的研究 “Sample—Efficient Learning to Solve a Real—World Labelth Game Using Data—Augmented Model—Based Reinforcement Learning to Solve a Real—World Labelth Game”,这款人工智能机器人在短短五个小时的训练数据中就掌握了BRIO迷宫游戏,超过了以往任何已知的尝试。
Brio迷宫游戏可能对一些人来说很熟悉,它是对精细运动技能和空间推理的测试,要求玩家通过倾斜操场来导航钢球通过迷宫。
尽管它表面上简单,游戏是复杂的,由于球和墙壁之间的关系,表面不规则,和非线性控制旋钮动态。这些挑战使得迷宫成为应用和评估最先进的机器人学习方法的理想选择。
由Thomas Bi和Raffaello D’Andrea教授领导的苏黎世联邦理工学院团队开发了一种使用相机图像从迷宫中提取有效观察的方法。
人工智能的学习过程基于基于模型的强化学习,使用由迷宫中的进展定义的奖励函数。
经过训练,AI机器人以76%的成功率成功通过迷宫,平均完成时间为15.73秒。这略好于15.95秒的人类最好纪录。
研究如何运作
该系统使用摄像头捕捉自上而下的图像,提取关键数据,如球的位置和迷宫布局。机器学习 技术反映了观测结果,以增强训练数据,生成更多样化的数据并提高泛化能力。
这项研究代表着在动态、真实世界环境中应用人工智能方面向前迈出了实质性的一步。ETH团队计划将他们的项目开源,相信他们的系统可以作为进一步人工智能研究的有价值的现实世界基准,因为它的空间要求低,成本适中,硬件设置简单。
进一步的研究结果发表于 在这个网站上,你还可以在下面观看一段有趣的机器人系统工作的视频。
该研究的合著者之一,教授, 拉斐尔·德安德烈 他说:“我们相信这是研究现实世界机器学习和人工智能的理想测试平台。在CyberRunner之前,只有拥有大量预算和定制实验基础设施的组织才能在这方面进行研究。
“现在,花不到200美元,任何人都可以从事尖端的人工智能研究。此外,一旦成千上万的CyberRunners进入现实世界,就有可能在全球范围内进行大规模的实验,在那里学习并行进行。公民科学的终极!”
将先进的人工智能系统应用于实用的机器人系统一直是人们非常感兴趣的事情。研究人员最近使用人工智能建造了一个机器人,能够自动从岩石样本中制造氧气催化剂,DeepMind合作建立了一个能够发现和合成化合物的自主研究实验室。
苏黎世联邦理工学院的人工智能机器人展示了先进人工智能技术在解决现实世界挑战方面的潜力,弥合了人工智能理论能力与其在物理环境中的实际应用之间的差距。
未来,这些技术将结合在一起,使高效、智能的机器人系统能够自主处理复杂的现实任务。