10：1!DeepMind人工智能在《星际争霸2》人机对战中完胜职业玩家

发布时间： 2019-01-25 17:49 | 来源：百度新闻 | 作者：巧天工 | 责任编辑：波少

【TechWeb】1月25日消息，据国外媒体报道，在人机围棋大战中打败柯洁、李世石等一众围棋高手之后，谷歌旗下人工智能公司DeepMind又将人机大战转向了电脑游戏，而在《星际争霸2》的人机大战中，谷歌DeepMind的人工智能程序以10:1的成绩完胜人类职业选手。

谷歌DeepMind研发的用于人机对战的人工智能程序名为AlphaStar，其挑战的是两位《星际争霸2》的职业玩家“TLO”和“MaNa”，比赛在去年的12月进行，《星际争霸2》的开发商暴雪和谷歌DeepMind已公布了当时比赛的视频。

在AlphaStar 与“TLO”和“MaNa”去年的对战中，使用的是略微过时的《星际争霸2》版本，这一版本在设计上便于人工智能程序进行相关的研究。

“TLO”和“MaNa”与AlphaStar各进行了五局比赛，但“TLO”和“MaNa”在比赛中并未占据优势，最后的结果都是AlphaStar全胜，对决结果定格在了尴尬的10:0。

在所公布的比赛视频中，谷歌DeepMind推出了一个新版本的AlphaStar，与“MaNa”进行比赛，新推出的AlphaStar对视野进行了限制，“MaNa”也得以发现的AlphaStar的部分不足并最终也战胜了它，用一局胜利为人类职业玩家挽回了一丝颜面，AlphaStar也在与职业玩家的对战中首尝败绩。

在与AlphaStar进行对战的视频中，“TLO”曾表示他有信心战胜AlphaStar，但不曾想后者在五局中全部获胜，而且每次都采用了完全不同的策略。

“TLO”之后的“MaNa”，在比赛中也拼尽全力，但并未摆脱与“TLO”相同的命运，他在与AlphaStar的五局比赛中也均已失败告终。

外媒在报道中表示，人工智能程序在电脑游戏方面存在较多的优势，包括“TLO”和“MaNa”在内的职业玩家，玩电脑游戏时每分钟的鼠标点击量方面存在理论上的限制，而人工智能程序则没有这方面的限制。

其次，外媒在报道中表示，人工智能程序的反应时间约为350毫秒，AlphaStar在反应速度方面比大多数的职业玩家要慢一些，但在通过大量的训练之后，人工智能程序变得更聪明，更有效率的决定弥补了反应时间方面的不足，这也是人工智能程序在游戏中的一大优势。

其三，虽然古语有“眼观六路耳听八方”，历史上也不乏视野开阔的高手的传说，但在游戏中，这一点对职业玩家并不太适用，反而更适用于人工智能程序，相关的技术使其对游戏全部区域有更好的掌控，人类玩家则需要花费时间关注不同的区域。

AlphaStar对游戏全部区域有更好的掌控能力这一点，在其与“MaNa”的最后一局中也得到了印证，在那一局中，谷歌DeepMind对新推出的AlphaStar进行了视角方面的限制，在对所进行游戏的全部区域的注意力方面就不再有明显的优势，“MaNa”也就有时间发现AlphaStar的缺点并最终战胜它。

AlphaStar在《星际争霸2》方面的技能，来自于开发商DeepMind对其进行的深度训练，DeepMind回放了大量人类玩家游戏时的视频，也是基于相关的数据训练神经网络，在持续一周的时间里，AlphaStar玩了相当于200年的《星际争霸2》。

AlphaStar目前在游戏方面的水平及超快的学习能力，对《星际争霸》方面的职业玩家来说并不是个好消息，但也不全是坏消息，职业玩家也能从中学到部分有用的策略，毕竟AlphaStar通过训练所积累的游戏经验远高于职业玩家。

上一篇：谷歌新AI打《星际争霸2》比赛详解靠不同策略并非手速

下一篇：10：1，AlphaStar横空出世，碾压星际争霸2人类职业玩家 TLO 和 MaNa

英雄联盟更多