让alpha GO挑战星际争霸2?现在或许还为时尚早

发布时间: 2018-12-30 23:03 | 来源: 百度新闻 | 作者:巧天工 | 责任编辑: 波少

在去年11月的暴雪嘉年华上,暴雪公司曾与alpha GO的出品方、世界最前沿的人工智能企业DeepMind达成协议,双方将在《星际争霸》系列游戏中进行深度合作。8月9日,DeepMind与暴雪共同发布了协议计划的第一个成果:基于《星际争霸2》的人工智能研究环境——SC2LE。

也许早先alpha GO在传统竞技娱乐项目中的骄人成绩令很多玩家认为“人工智能打游戏”不过是小菜一碟。但从日前公布的研究成果来看,让alpha GO与人类玩家在《星际争霸》中一较高下还为时尚早。

让alpha GO挑战星际争霸2?现在或许还为时尚早

与其说人工智能要挑战《星际争霸2》,倒不如说是后者在主动请战

电脑玩家与人工智能

对于人工智能,相信很多玩家都会抱有一个疑惑:包括alpha GO在内的人工智能在电子游戏中的表现与我们常见的电脑玩家到底有什么不同呢?

所以,在探讨“人工智能的星际水平”之前,让我们先来聊聊人工智能与电脑玩家。

由于某些历史原因,我们习惯性地将游戏中的电脑玩家或游戏角色称之为AI(人工智能缩写),然而事实上,电脑玩家与人工智能在游戏中的工作原理是截然不同的。(下文出现的AI皆指人工智能而非传统意义上的电脑玩家)。

让alpha GO挑战星际争霸2?现在或许还为时尚早

真正“冷酷”的不是AI,而是游戏

在大部分电子游戏中,电脑玩家与人类玩家之间的竞争在游戏信息的掌握上是非对称的。以即时战略类游戏为例:对战中,电脑玩家对于游戏全局全知全能,“战争迷雾”的概念也形同虚设。电脑无时无刻不在洞悉玩家的动向,并能依照设定难度的不同,对玩家的行为予以对应强度的反馈。尽管电脑玩家会在游戏中表现出某些人类化的行为,甚至产生看似偶然的失误,但这不过是在结合了各种信息之后,刻意做出的“放水行为”。从本质上来讲,电脑玩家并非“玩家”,而是游戏自身的一部分。

相比之下,AI则在信息的获取与反馈上与人类玩家完全对等,它在游戏中需要遵从人类玩家的游玩规则。简而言之,AI同样需要“一台显示器、一副键盘与鼠标”。虽然这套设备在很多情况下甚至并不具有实体,仅仅通过函数编程来实现,但AI与它们的互动模式却与我们并无二致。AI可以像我们一样对屏幕内显示的信息予以判断和处理,并根据可视区域内的情况及时按下键盘与鼠标进行操作才能与游戏环境进行交互。而直到现在,“如何让AI有效地使用这套显示器与键鼠设备”依然是项目研究的难点之一。

让alpha GO挑战星际争霸2?现在或许还为时尚早

人工智能眼中的《星际争霸2》

DeepMind到底做了啥?

本次公布的SC2LE(《星际争霸2》学习环境)让研究者可以在Linux系统下接入游戏API(应用程序编程接口),开展自己的人工智能研究。这项技术实现了程序语言与玩家游戏操作的互通,研究者通过编程指令让AI模拟人类玩家的信息处理习惯与游玩方式,让AI通过不断地学习与调整获得更强的处理能力。

在DeepMind看来,人类玩家所擅长的领域对于AI性能的评判来说是至关重要的基准。因此,研究AI在电子游戏中的实际应用对于人工智能技术的发展来说具有非凡意义。

让alpha GO挑战星际争霸2?现在或许还为时尚早

DeepMind在公布研究结果的同时狠狠吹了一把《星际争霸2》……

本次公布的SC2LE是一个在《星际争霸2》中加速AI研究的工具集,简单来说,它大致包括了以下几个部分:

由暴雪开发的机器学习 API,可以让研究者与开发者进入游戏内部环境;

匿名游戏录像的数据集以供AI学习参考;

一个开源版本的工具箱(名为PySC2),可以让AI轻松地获取游戏中抽象化的地图信息(使AI像人类玩家一样“观察”地图,获取所需信息);

一系列简单的强化学习小游戏,包括:操作农民移动到特定地点、采集水晶与气矿、建造兵营等,允许研究者测试AI在具体任务上的性能。

SC2LE为广大人工智能研究者提供了一个公共的竞技场,让所有人工智能爱好者都可以更加便捷地进入游戏环境,参与人工智能的创作与训练。与此同时,可以预见的是,在正式挑战人类之前,AI作者们之间的争锋较量也将会更加激烈。

让alpha GO挑战星际争霸2?现在或许还为时尚早

工具箱中提供的强化学习小游戏

为什么选择《星际争霸》?

众所周知,《星际争霸》是史上最成功的即时战略类游戏之一。系列游戏早早进入了电竞化,各类竞技赛事也持续了20年以上。

同大多数游戏一样,《星际争霸》的取胜条件是击败对手,但在即时战略的规则之下,玩家需要在游戏中顾及、平衡战力以外的多项信息指标,比如:收集水晶、气矿资源、通过建造建筑提高人口上限等。同时,一场《星际争霸》比赛的时间从几分钟到数小时不等,这也意味着游戏中即时进行的操作并不会立刻获得可见的收益。另外由于“战争迷雾”的存在,人工智能在游戏过程中必须要结合历史记忆与长期规划。

让alpha GO挑战星际争霸2?现在或许还为时尚早

“战争迷雾”为双方玩家提供了保护伞

《星际争霸》具有极其丰富的多层次游戏机制,并且由于数量庞大的玩家群体,研究者可以轻易获取大量的游戏记录数据以供AI学习参考。另一方面,大量的人类玩家也为AI提供了优秀的竞争对手。于是,对于人工智能研究来说,《星际争霸》是再理想不过的环境。

《星际争霸》初代也曾为人工智能及机器学习研究者所关注,AAAI人工智能与交互式数字娱乐年度会议(AIIDE)每年也都会举办《星际争霸 母巢战争》的AI对战比赛。在比赛的最后,会议主办方还会安排一场优秀AI与人类玩家的比赛,而从近年的比赛结果来看,AI要战胜人类顶尖玩家还有很长的路要走。

  • 上一篇:暴雪终于想通了?《星际争霸2》将于11月16日起免费畅玩!
  • 下一篇:《星际争霸2》平衡性大改变动:先知反隐时间缩短
  • 英雄联盟更多
    刀塔2更多
    CS:GO更多
    绝地求生更多