【重磅】DeepMind进军星际争霸2,谷歌Facebook打响通用AI战争

发布时间: 2019-01-27 06:42 | 来源: 百度新闻 | 作者:巧天工 | 责任编辑: 波少

20万,这是新智元今天达到的用户总数。在飞向智能宇宙的旅程中,感谢每一位和新智元同行的朋友。您的关注和支持是“新智元号”星舰永不枯竭的燃料。

 

  【新智元导读】7日,Facebook刚刚宣布开源史上最大的《星际争霸》游戏数据集STARDATA。今天(10日)DeepMind在官方博客上宣布开源星际争霸2 研究训练平台SC2LE。AI 巨头挑战星际争霸的角逐愈演愈烈。乌镇围棋峰会上,DeepMind CEO 哈萨比斯曾说,星际争霸将成为AI进步的下一个大考验。

  国内AI 资深专家袁泉此前曾深入研究过星际争霸中的若干AI问题,和UCL共同发表了多智能体协作网络BiCNet,第一次展现了AI在星际微观战斗中的五类智能协作方式。新智元对此做过专门报道。此次DeepMind 和暴雪最新发布的星际争霸 2 AI开放研究平台的论文中,也多次引用了袁泉团队的工作。因此,袁老师应新智元之邀做了特别点评。他指出了此事的两点意义:

  第一点:星际 2 的搜索和决策空间比 AlphaGo 围棋大了多个“数量级”,DeepMind、Facebook 等越来越多的优秀团队参与到这项研究中,很可能创造出更好的下一代AI的新技术。因为按之前玩围棋的技术框架的话,蒙特卡罗树搜索加深度强化学习,应该是不能完全解决星际中的问题,尤其是full game智能策略方面的难题。此次DeepMind和暴雪在AI开放平台、API标准化、性能架构上做了不少细致卓越的工作,为今后的研究打下了好的基础,希望国内有志于此方向的老师同学积极投入到此项研究工作中。

  第二点: SC2LE 开放平台,相对于大家之前做的星际1的平台,最大的一个优势是提供了很多端到端的内容操作的接口,发展出来可以通过接口像人一样打星际,进行控制,这种接口是在之前的星际1平台上不提供的。基于这一点,未来有可能大家可以会看到机器人像人一样坐在电脑前,操作鼠标打星际和高手对决,对机器人等相关领域也是很好的促进!DeepMind 最新发布 SC2LE,推动星际争霸 2 AI 研究

  DeepMind 刚刚在博客中宣布,与合作伙伴暴雪一起,发布了一套名为 SC2LE (StarCraft II Learning Environment)的工具组件,这套工具组件将加速即时策略游戏星际争霸 2 中的 AI 研究。

星际争霸 2 是 2010 年发布的即时策略游戏

 

星际争霸 2 是 2010 年发布的即时策略游戏

  根据 DeepMind 的博客所说,SC2LE 包括:

  一个由暴雪开发的机器学习 API,能够让研究者和开发者参与到游戏中来。其中还包括面向 Linux 的工具的首次发布。(GitHub 地址在此:#replay-packs)

一个匿名游戏回放数据集。在未来几周内,其大小将从 65k 增加到超过 500k。

 

一个匿名游戏回放数据集。在未来几周内,其大小将从 65k 增加到超过 500k。

一个开源版本的 DeepMind 工具集PySC2,允许研究者较容易地使用暴雪的 feature-layer API 和自己的智能体。

 
  一个开源版本的 DeepMind 工具集PySC2,允许研究者较容易地使用暴雪的 feature-layer API 和自己的智能体。

一系列简单的强化学习迷你游戏,使研究者可以在特定任务上测试智能体性能。

 
  一系列简单的强化学习迷你游戏,使研究者可以在特定任务上测试智能体性能。

  一篇 DeepMind 和暴雪的联合论文,论文对作为研究环境的星际争霸 2 进行了概述,报告了在迷你游戏上的初始基准结果,基于回放的监督式学习,以及对抗游戏 AI 的 1 v1 ladder 游戏(论文介绍见文后)。

星际争霸 2 AI 研究进一步瞄准通用人工智能和真实世界的任务

 

星际争霸 2 AI 研究进一步瞄准通用人工智能和真实世界的任务

  DeepMind 一向以开发能够学习解决复杂问题的 AI 系统、推进 AI 边界为使命。从设计用来研发通用人工智能和机器学习系统的第一人称视角 3D 游戏平台 DeepMind Lab ,到围棋、Atari 这样的游戏,DeepMind 一直在广阔多样的环境中设计智能体并测试其能力。

  星际争霸和星际争霸 2 一直以来都位列最成功的大型游戏之中,相关比赛已经举办了 20 多年。其原始游戏就已经被 AI 和机器学习研究者所用,每年都有 AIIDE bot competition。星际争霸长盛不衰的部分原因在于其丰富、多层面的游戏过程,这也使得其成为 AI 研究的理想环境。

  关于星际争霸作为 AI 研究和智能体“竞技场”的历史,可以参见这篇文章:星际AI 争霸 6 年简史:通用人工智能角斗场,DeepMind 确认应战。

  实际上,早在2016年11 月,DeepMind 工程师 Oriol Vinyals 就在公司博客公布,DeepMind 将和暴雪合作,让星际争霸2 成为人工智能研究场景,并开放给所有的人工智能研究者。

  Oriol Vinyals 少年时期曾是西班牙的顶级星际争霸玩家,他当时坦言,“要打败人类职业选手,机器尚有很长的路要走。

  他当时在博客中写道,DeepMind 之所以选择星际争霸2作为人工智能研究的目标,是因为它的复杂性:玩家必须做出高级战略决策,同时还要控制数百个元素,并快速做出各种决定。Oriol Vinyals 认为,跟国际象棋和围棋相比,星际争霸更能模拟真实世界的混乱状况。他说:“如果要让智能体程序学会玩星际争霸,它需要有效利用记忆,还要能制定长远计划,而且能根据最新信息调整计划。”他认为,如果能开发一套机器学习系统,让它掌握操作星际争霸的技巧,这种技术将最终可以用来执行真实世界的任务。

  此后,《星际争霸》的制造公司暴雪娱乐建造总监 Tim Morten 对媒体确认,AlphaGo 将挑战《星际争霸2》。

  AI研究者现在可以使用开放工具构建自己的模型,来应对星际争霸的技术挑战

  此次 SC2LE 的发布,无疑是 DeepMind 将之前的宣言付诸了行动。在这篇最新的博客中,DeepMind 又阐释道:

  • 上一篇:机械虫族来袭!星际争霸2战争宝箱第三季上线
  • 下一篇:《星际争霸2》赛事宝典:最常用的胜利战术
  • 英雄联盟更多
    刀塔2更多
    CS:GO更多
    绝地求生更多