谷歌明星科学家:即使《星际争霸 2》衰落,其学习环境的架构和(2)
时间:2019-02-12 10:10 来源:百度新闻 作者:巧天工 点击:次
也正是因此,Oriol 才在圆桌环节表示,即使《星际争霸 2》因为时间的变迁而衰落,但这个学习环境的架构和理念,可以使其变成其他平台的 AI 技术。不只是游戏,还包括了无人驾驶、人脸识别等等。 AI 能否通过《星际争霸》战胜人类?自从柯洁和李世石纷纷输给 AlphaGo 之后,人们更关心这样一个问题,“AI 可以打败人类吗?” 尤其是对于谷歌的 AI。 2016 年 10 月的暴雪 Bliizcon 2016 上,DeepMind 宣布和暴雪共同以《星际争霸 2》作为研究环境,来释放 AI 技术的潜能。前者称,游戏是完美的环境之一,使该企业能够快速有效地开发和测试 AI,以此提高算法的灵活性,最终通过游戏分数(胜负)来提供即时反馈。 2017 年 10 月,在第十三届人工智能和交互数字娱乐大会(Conference on Artificial Intelligence and Interactive Digital Entertainment 简称 AIIDE’17)上,社会各界的 AI 研究者们纷纷带着他们的《星际争霸》AI 来参加比赛。其中,使用异虫种族的 ZZZKbot 以 2465 胜 501 负的战绩拿下了冠军。 然而,就在这场比赛的十几天后,韩国上演了一场《星际争霸》人机大战。韩国前职业选手 stork 以 4:0 的巨大优势碾压了 ZZZKbot、TSCMO、MJ 这三个世界上水平最高的《星际争霸》AI。即使这场比赛对于 AI 领域来说,意义非常重大,但一些专业的《星际争霸》选手认为,这场比赛并不好看,因为整个游戏的节奏完全倒向了 stork,AI 毫无取胜的可能性。 (轻松赢得胜利的 Stork) AI 在《星际争霸 2》上面临的挑战有增无减,但是对于 Oriol 来说无疑是个特大喜讯。他曾这样评价过基于《星际争霸 2》的学习环境,“这是一个多人互动的多主体(指玩家、单位、建筑)环境,由于地图上的『战争迷雾』,AI 和玩家所获得的信息是不完整的。 《星际争霸 2》不仅有数百个单位的控制空间,还能提供一个从原始特征(画面、缩略地图)获得信息的平面空间。再加上资源分配(水晶和气矿),因此 AI 每做出一步动作,就要思考数千步战略。” Oriol 在演讲中指出,即使评价系统已经给现在的 SC2LE 做出极高的评价,但是和职业人类玩家相比,简直是小儿科。不过他倒是很开心,因为只有挑战才能给予 DeepMind 前进的动力,也只有战胜问题,才能赋予 AI 更强的能力。 同时,Oriol 指出,AI 存在很大的成长空间。他以 AlphaGo 为例,该 AI 在对战李世石时的能力是对战柯洁时的三分之一。换句话说,短短几个月,AlphaGo 就成长了三倍之多。或许,真的会有一天,SC2LE 会轻松击败职业玩家,正如今天我们轻松击败他们一样。 一切从《星际争霸 2》开始,功在当下,利在千秋要知道比起 AI,Oriol 更喜欢的是《星际争霸》。他从 15 岁就开始接触这款游戏,更是借助它在西班牙创出了一些名堂。事实上,公开资料显示,Oriol 曾在微软就职,并从事《星际争霸》对战 AI 的开发。用于在玩家无法寻找到对手时,替代人类对手与玩家交战。 也许,正是这件事情给了 Oriol 灵感。他在圆桌讨论时指出,《星际争霸 2》可以用来训练 AI,那么 AI 是否可以训练玩家如何玩《星际争霸 2》呢?以 AlphaGo 为例,它通过对抗,创造了自己的独特的战术,而这个战术可以被人类选手拿来应用于其它棋局。 (Oriol 正在讨论) 《星际争霸 2》相较于围棋来说拥有更多的地图、更多的可能性,SC2LE 极有可能创造出独特的战术。那么,把这种战术用于训练人类玩家,尤其是零基础的玩家,可能会比让新手自己体验游戏高一些。 实际上,时间沉淀技术,《星际争霸 2》这款诞生于过去的游戏,结合当下火热的 AI 技术,二者所塑造的无疑会是未来更自动化的生活。 Oriol 指出,DeepMind 所做的事情是建立平台。 他认为,这就和科学家不能左右他们的研究成果一样,SC2LE 会面向更多的开发者和《星际争霸 2》玩家。Oriol 非常愿意开源这些平台,这是因为他认为 AI 需要创新者,他们能够让 AI 实现更多的功能。 Oriol 所描绘的画面,正是今后的 AI 社会。虽然不知道何时才能到来,但是功在当下,利在千秋。 题图来自 《星际争霸 2》 (责任编辑:波少) |