AlphaGo挑战人类《星际争霸2》：必遭暴虐

发布时间： 2018-12-31 22:21 | 来源：百度新闻 | 作者：巧天工 | 责任编辑：波少

在 AlphaGo 战胜了韩国围棋棋手李世石后，DeepMind 创始人戴密斯·哈萨比斯（Demis Hassabis）就曾表示将研究以人工智能与人类玩其他游戏，例如即时战略游戏《星际争霸》。不过目前看来，DeepMind AI要跟人类比赛打《星际争霸》这事，还是有点儿悬。

早在2015年，DeepMind AI就开始用已经雅达利1977年发行的游戏机Atari 2600来进行游戏训练，整个训练过程团队没有提供任何额外信息帮助，全依靠AI自己来一步步学习如何打怪升级。在这些游戏里，有一款游戏始终让DeepMind AI很苦恼，那就是《Montezuma’s revenge》，这是雅达利一款难度超高的游戏。

后来团队找到了“好奇心”激励机制，来让DeepMind AI获胜。他们给AI变成编程输入“人工好奇心”，在AI探索更多的玩法的时候给予它更多的奖励，鼓励它去用不同的途径来获取更高的分数。在新版本里，DeepMind AI在好奇心的驱动下探索了15个房间的游戏。在没有好奇心的时候，它只玩了2个房间。

今年3月底，在AlphaGo五局四胜赢了李世石之后，暴雪娱乐制作总监Tim Morten就在WCS中国区总决赛上确认，DeepMind AI将挑战《星际争霸2》，当时Tim Morten就直言DeepMind AI不会在《星际争霸2》中战胜人类。直接目前，这一场人机游戏争霸战，官方都没透露更多的细节。

实际上，《星际争霸》作为一款即时战略类的游戏，给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面，两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据，而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏，《星际争霸》需要在极短时间内执行策略，而围棋相对来说则有充足的时间给AI运算思考。

目前，DeepMind AI想要打赢《星际争霸》还是需要更长的时间学习和摸索。

AlphaGo挑战人类《星际争霸2》：必遭暴虐