谷歌DeepMind实验室是开源的 所有信息都在这里_附论文中文版 热点在线

2023-05-27 15:42:35    来源:互联网

据DeepMind介绍,DeepMind Lab是一个类似3D游戏的平台,专门为基于Agent(虚拟代理)的AI研究而设计。

DeepMind成立于2010年,致力于开发人工智能代理。它开发的AI代理可以熟练操控很多街机游戏,比如《太空入侵者》(太空入侵者)和《吃豆人》(吃豆人)。最近,他在复杂的围棋游戏中击败了世界高手李世石。

对于DeepMind Lab,DeepMind的联合创始人Shane Legg和其他几位员工在一篇博文中表示:“它通过模拟代理人的眼睛,从自己的角度进行观察。它以丰富的科幻视觉呈现场景。可用的操作可以使代理在3D中四处查看和移动。智能体的形状是一个悬浮球体,它的悬浮和运动是通过激活与预期运动方向相反的推动器来实现的。它还有一个摄像头,可以观察它旋转时的运动。”


(资料图片)

“示例任务包括收集水果、走过迷宫、穿过危险通道和避免从悬崖上跌落、使用发射台在平台之间移动、玩激光笔,以及快速学习和记忆随机生成的环境。”

Deep Lab将几个不同的AI研究领域整合到一个环境中,以方便研究人员测试AI代理的导航、记忆、3D视觉等能力,以及它们在规划和策略方面的表现。

DeepMind在他的博客中说:“这里的每一项任务都被视为前沿研究问题。我们将它们放在一个平台上,这代表了该领域的一个重要新挑战。”

DeepMind Lab适应性强,可扩展。它包括一个可编程的关卡创建界面,可以根据游戏玩法逻辑、物体拾取、特定观察、关卡重播、奖励机制和游戏内消息生成定制的关卡。

DeepMind说:“我们相信它对我们理解智能的各个方面(包括自然智能和人工智能)产生了重大影响。然而,我们目前的努力只是挖掘了DeepMind Lab的一小部分潜力。在一些尚未涉及但可以在DeepMind Lab中有所作为的研究领域,如导航、记忆和探索,仍有许多重大发现的机会。”

Deepmind表示,DeepMind Lab平台的所有代码都将上传到Github(开源和私有软件项目的托管平台),供研究人员和开发人员进行实验和研究。

以下是DeepMind在公司网站上发表的关于DeepMind实验室的学术论文:

摘要

Deep Lab是第一人称3D游戏平台,专为研究通用人工智能和机器学习系统而设计。DeepMind Lab可用于研究自动代理如何学习在大规模、部分可见和视觉多样的环境中执行复杂任务。DeepMind Lab有一个简单灵活的API,可以用来探索创造性的任务设计和全新的AI设计,快速迭代。它由一个快速且被广泛认可的游戏引擎驱动,并为开发者社区的高效使用而定制。

介绍

通用智能(GI)衡量代理(虚拟代理)在各种环境中实现目标的能力。目前,自然界中唯一已知的一般智力的例子是动物。动物通过基于身体和感官条件的进化、发展和学习产生智力。人类和其他动物的智力可能在很大程度上是其环境多样性的结果。没有这种环境,智力可能不会产生。一种选择是直接研究物理世界中机器人的具身智能(EI)。然而,这方面的研究通常会遇到一些障碍,如时间太慢和相关硬件成本太高。另一个选择是研究现实的虚拟世界,这样就可以解决以上两个阻力。

此前,创建一个真实的虚拟世界作为人工智能研究平台的工作受到了大量工程的阻碍。这一次,为了解决这个问题,我们推出了DeepMind Lab。Deep Lab是一款第一人称3D游戏平台,构建于游戏开发者id软件公司的《雷神之锤3:竞技场》 (Quake III:Arena)游戏引擎之上。

它以丰富的科幻视觉呈现场景。可用的操作可以使代理在3D中四处查看和移动。比如采集水果、穿越迷宫、穿越危险通道和避免掉下悬崖、使用发射台在平台间移动、玩激光笔、快速学习记忆随机生成的环境等。DeepMind实验室已经成为DeepMind内部的一个主要研究平台。例如,它被用来开发强化学习的异步方法,无监督的

督的辅助工作,以及学习导航等。

人们可能会将DeepMind Lab与其他游戏AI研究平台(强调“像素到行动”的自主学习智能体)相比较。例如,DeepMind之前使用的“街机学习环境”(Arcade Learning Environment)既不是3D,也不是第一人称。而在3D AI研究平台中,DeepMind Lab不仅能与VizDoom和Minecraft等平台相提并论,还拥有比这些平台更强大的功能。例如,DeepMind Lab拥有更丰富的视觉效果和更自然的物理效果。

DeepMind Lab的人工通用智能(AGI)研究主要强调原始像素输入(raw pixel inputs)、第一人称视角、运动控制、导航、规划、策略、时间,完全自主的智能体必须通过探索周围环境自主学习要执行什么任务。所有这些因素都使得学习变得非常困难。这里的每个任务都被视为处于前沿的研究问题。我们把它们放在一个平台上,代表了这个领域的一个重要的新挑战。

DeepMind Lab研究平台

DeepMind Lab建立在游戏开发商id software公司的《雷神之锤3:竞技场》(Quake III:Arena)游戏引擎之上。DeepMind Lab还包含一些工具,主要来自q3map2(GtkRadiant,关卡编辑器)和bspc(bspc,关卡编辑器),用于关卡生成(level generation)。机器人(bot)脚本基于OpenArena项目(《雷神之锤3:竞技场》的开源内容包)代码。

标签:

X 关闭

X 关闭