OpenAI使用SEGAGenesis的SonicTheHedgehog系列游戏发起了一项迁移学习竞赛。面临的挑战是要创建最佳的代理来玩Sonicgames的自定义级别,而在开发过程中却无法访问这些级别。
比赛使用Gym Retro,这是视频游戏模拟器核心的包装,其中包括对多个经典游戏机的支持以及包括30个SEGA Genesis游戏在内的不同游戏的数据集。
Gym Retro是OpenAI的第二代尝试,旨在建立大型的强化学习环境数据集。它建立在Universe的基础上,我们在2016年发布时曾报道过它,因为它的环境异步运行,只能实时运行,并且由于基于屏幕的游戏状态检测而变得不可靠。Gym Retro将Arcade学习环境的模型扩展到更大范围的潜在游戏中。
在比赛介绍中,OpenAI博客介绍了:
在典型的RL研究中,算法是在训练它们的相同环境中进行测试的,这有利于具有良好记忆性且具有许多超参数的算法。相反,我们的竞赛在以前看不见的视频游戏级别上测试了一种算法。
信用:OpenAI博客
比赛于4月5日开始,持续到6月5日,提供了Sonic The Hedgehog游戏的一组训练级别,并根据为比赛创建的自定义级别的测试集评估了参赛者的算法。为了帮助您入门,OpenAI发布了几种RL算法,您可以在GitHub的aretro-baselinesrepo中对其进行调整。
从基线结果可以看出,即使人类玩了一个小时,而算法只玩了18个小时,RL算法仍然远远低于人类的表现-红色虚线。
Open AI的技术论文中详细介绍了一些基准结果以及旨在衡量RL域中的转移学习和少量学习算法性能的新基准。
要参加比赛,您需要在OpenAI上注册,并具有Steam用户名和密码。Retro Contest页面上提供了设置Gym Retro以及使用Python创建简单代理的详细信息。Leaderbord目前拥有两类得分-五支球队的得分约为3,700,另外15支得分约为13,500。但是还有八个星期的时间,这一切仍然值得一试-还是应该训练。
有两个奖项类别,“最佳分数”和“最佳写作”。为了有资格赢得比赛,您必须在比赛结束时将您的提交作为开源发布。每个类别的第一,第二和第三名优胜者将获得奖杯。此外,还将获得“最佳辅助材料”奖。将邀请所有获奖者与OpenAI共同撰写有关比赛的技术报告。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。