北京时间1月25日凌晨2点,暴雪与谷歌DeepMind团队合作研究的星际争霸人工智能“AlphaStar”正式通过直播亮相。按照直播安排,AlphaStar与两位《星际争霸2》人类职业选手进行了5场比赛对决演示。加上并未在直播中演示的对决,在人类vs AlphaStar人工智能的共计11场比赛中,人类只取得了一场胜利。
这场大战以人工智能的近乎完胜而告终。从结果来看,人类似乎很快就无法在《星际争霸2》这款难度非常高的游戏上与人工智能相抗衡。
本文将会以较专业的星际技战术角度出发,通过较为通俗的讲解,帮助大家理解这场胜利的意义究竟在哪里。
(特别鸣谢KevinLiu对本文中人工智能专业内容指导)
1. 这场胜利真的意味着《星际争霸2》中人工智能已经可以战胜顶尖人类了吗?
尽管这次比赛人类没有派出当前实力最强状态最好的职业选手出战,但显然已经有很多朋友希望通过”人工智能是否已经具备战胜人类职业选手的实力“来参考不久的未来人工只能是否有机会“击败全人类”。
所以回答这个问题其实需要一个必要条件。那就是看如何看待挑战人类的人工智能。以绝大部分星际2的专业人士看法,如果人工智能战胜人类,应该是通过和人类差不多的操作或是比人类对游戏更先进的战术理解来取胜,才足以让人信服。
那么这次比赛中两位输给人工智能的选手能够让人信服吗?
恐怕很难。
第一个出战的TLO在比赛中使用了他不擅长的种族,所表现出的技战术实力只能达到普通业余玩家的水平,甚至连业余高手都略有勉强。那么自然也就没有了参考“战胜职业选手“的意义了。只能说,与TLO对决的这款AlphaStar,已经拥有了在PvP(神族vs神族)对抗中略强于一些业余玩家的技战术水平了。
第二个出战的MaNa可是正经的使用最擅长种族的职业选手了,巅峰时期也曾拿过暴雪世锦赛的亚军。但MaNa依然输给了人工智能。
这场胜利有参考意义吗?
客观的说,还有异议。
大部分人持反对意见的原因非常明显,战胜MaNa的这款AlphaStar拥有着超乎人类生理极限的操作能力。
毕竟人类希望和围棋一样,在一个相对平等的条件下与人工智能对决,从而让人类认识对这个游戏玩法的认知积累是否还存在缺陷。
所以在如何保证平等条件的争论中,是否需要像人类一样模拟受迫性失误、是否需要像人类一样有反应阈值一直都存在激励争议。但在是否拥有超越人类胜利极限的运动能力上,确是争论极少的,毕竟人们在对人工智能对抗人类的主流认知中,是希望人工智能对手也是个虚拟的人。
回顾MaNa和AlphaStar的那五场大战,以在直播中播放的一场比赛为例,AlphaStar所展示的三线追猎牵制操作是人类几乎不可能完成的。完成这种操作必须要在那长达1分多的时间内保持非常快的手速、精准的鼠标点击、精准的屏幕移动以及距离判断,更重要的是要杜绝人类基本无法克服的受迫性失误。
通俗点说,如果同样是带兵打仗,我的排兵布阵和打仗策略和你差不多,但你的部队不知疲倦,我军打累了要休息而敌军依然还能扛着大刀往前杀,那就有点赖皮了。
除此以外,目前的AlphaStar在技术上仍有很大的局限性。从当天的比赛来看,目前DeepMind能向大家展示的只能局限在唯一的地图、唯一的种族对抗以及唯一的平衡性环境中。相比需要应对每个赛季至少4-5张不一样的地图、三个不同种族对抗、经常修改的平衡性版本的人类职业选手来说,就好比踢足球AlphaStar只和你比射点球,那怎么能算战胜人类?
但从纯粹的技战术角度来讨论,这一次人工智能大战还是给了人类一些启发,主矿的农民分配以及一些运营补农民的思路,确实给了一些核心星际玩家新的思路。
尽管抛开单纯的比分结果并不能让我们信服人工智能已经可以挑战甚至战胜职业选手,但从它所表现出的潜力已经学习程度来看,仍然是值得期待的。
2. 人工智能有哪些值得星际专业人士赞叹的地方?
在第一个问题中我们似乎一直在唱衰DeepMind团队研发的AlphaStar。但严格来说,DeepMind首次公开AlphaStar对于星际专业人士来说,仍然超出了预期,非常值得赞叹。
和一些命名为人工智能的星际脚本程序相比,AlphaStar更像我们想象的人工智能了,它会灵活的使用战术,作出更像是经过”思考“后的游戏指令。
AlphaStar所展现出的学习能力已经非常强大。它甚至已经学会判断优先攻击哪个目标、学会怎样使用对手的战术、以及基础的判断对手的打法和使用反制打法的能力,完成这些在我们看来比较抽象化的逻辑能力,就需要更加强大的算法能力了。
更加复杂的算法带来更加拟人化的高级逻辑推理能力也是DeepMind选择用《星际争霸2》来攻克人工智能技术瓶颈的原因之一。对于星际玩家来说 ,更加强大的逻辑能力自然有可能会诞生更多人类还没想到的新战术、新运营和新打法体系,这是非常值得期待的。
3. 未来的《星际争霸2》人工智能vs人类大战会是怎样?
要知道这次参赛的AlphaStar只进行了为期一周的自我对练和学习,但学习量已经相当于正常人的200年,这和AlphaGo一样,人工智能有着非常恐怖的算力。但毕竟目前技术水平的人工智能还不能像相对变数更少的的围棋那样完全驾驭和领悟《星际争霸2》这款游戏(在笔者之前撰写的《星际争霸人工智能AlphaStar比赛速记》中对此有详细阐述),因此即使有着 200年的学习量,今天所展示出的AlphaStar对游戏的整体理解能力依然不如只有短短数年学习量的人类强。
以目前的技术水平来看,AlphaStar的技术提升可能会存在很大的瓶颈。如果未来在算法上有较大的技术进步,AlphaStar可能会有非常大的学习进步,那么战胜人类最强职业选手或 是为人类启发新的《星际争霸2》打法就真的可以实现了。