阿法狗“同门”AI完爆《星际争霸2》,阿法星10比1吊打人类
时间:2019-01-27 10:12 来源:百度新闻 作者:巧天工 点击:次
业内:相比操控,AI运营能力值得关注 由于信息不对称、玩法复杂繁琐、策略瞬息万变等特点,让外界看来《星际争霸II》或许是人类在游戏领域人机对战最后一块“遮羞布”。 “星际争霸作为当前难度最高的即时策略游戏,首先存在"战争迷雾"机制,使得AI无法得知未探索区域玩家现阶段在布置何种战术,因此无法做出最优选择。“国内顶尖职业玩家TIME赛前曾向南都记者表示,游戏中的资源控制、升级顺序、种族与兵种间的互相等种种游戏细节,需要操作者对游戏平衡性有较为深刻的了解。 直播现场,DeepMind团队向外界介绍,他们通过回放了大量人类玩家游戏时的视频,对AlphaStar进行深度训练,让AI通过观察一个人所处的环境,尽可能地模仿某个特定的动作,理解游戏基本知识。 之后,团队使用了一个称为“Alpha League”的方法,从人类数据中训练出来的神经网络进行对抗,期间进行迭代与产生新的Agent(注:“智能体”、“代理人程序”,计算机术语)和分支,而Agent通过强化学习过程与“Alpha League”中的其他竞争对手进行对抗,积累面对不同的策略的经验,并从中最不容易被利用的5个Agent,命名为“the nash of League”,参与与人类职业选手的对抗。 DeepMind团队公布的视频显示,AphlaStar对上第一个职业选手TLO,为Liquid战队的“虫族”选手,目前世界排名第68。 由于规则设定,TLO只能使用“神族”,这对他的实力是有较大的约束的,而比赛他也是以5:0的比分落败。其中,AphlaStar的游戏操作十分亮眼。在接送、点残血、后退、骚扰等游戏细节和操控上,AphlaStar都游刃有余,有相关人士分析道,“AphlaStar在控制众多单位时对攻击距离的把握相当精确,这在游戏职业玩家中都算是比较极限的操作了,而AI能够较为轻易的是用出来”。 正是因为拥有强大的操控能力,使得AphlaStar能够精确的控制30个中级兵种单位的对抗MaNa手中的高级兵种单位,实现“以下克上”的效果,这在以往职业赛场是十分罕见的。 有专家表示,相比于游戏操作,更值得关注是AphlaStar的运营能力。在之前与MaNa的比赛视频中,AphlaStar方面不断的派着兵去骚扰MaNa基地,干扰对方发展,以至于AphlaStar经济常常是领先的。 目前短板:局势判断和应变能力“其实AI完成微操并不难,只要进行相对应的神经网络算法与强化学习,大部分AI都能达到。”有人工智能专家告诉南都记者,难就难在AI在大局观上与决策上,目前缺少一定的游戏局势判断和应变。 这种不足在MaNa与AphlaStar的现场对决中便显现出来。虽然此前MaNa同样以5:0的比分输给了AphlaStar,但是现场对决上MaNa则是拿捏到了AphlaStar的“命脉”。 虽然AphlaStar在运营能力与操作水平都占据上风,但是MaNa还是通过骚扰战术,让AlphaStar数十个单位的“追猎”来回往返前线和家中,逼迫后者陷入循环执行某种任务的怪圈,让其无法形成有效的局势判断,而最后MaNa通过强大的兵力压制,获得了胜利。 从“菜鸟”到“大师”,仅用两年时间 此前,2016年3月的WCS中国区总决赛上,暴雪娱乐制作总监Tim Morten就曾确认DeepMind的AI将挑战《星际争霸II》的消息。 不过,到2017年8月,DeepMind方面曾表示,AlphaGo还无法像人类一样同时处理多种事物,《星际争霸II》等即时策略类的游戏的操作空间太大。AI对其探索还处在非常早期的阶段,不仅需要训练各种“常识”,而且在面临突发情况时的应变能力也有所不足。 在2018年11月暴雪方面提到DeepMind的《星际争霸II》AI进展时,表示:“一旦人工智能模型掌握游戏的基本规则,它就可以开始进行如带农民Rush开局等有趣的行为。此外,在与“疯狂”难度的《星际争霸II》的AI模型对阵的时候,获胜概率可以达到50%。”不过,有职业选手曾对南都记者表示,“疯狂难度”的人机强度不大,“我们平时训练都用不上,对上它的胜率也接近100%。” 只用了短短两年时间,AI技术便在对抗人类职业选手中取得优势。 “我们正在试图理解人类以及我们大脑的工作方式。”暴雪首席软件工程师Jacob Repp向外界传达他们行为背后的逻辑,“如果我们能够得到这种高质量的数据流——人类玩游戏时的原始输入以及由此产生的结果——那就能成为研究人们行为的有用数据。” (责任编辑:波少) |