北京时间1月25日凌晨消息, 谷歌旗下DeepMind开发的人工智能(AI)程序“AlphaStar”在Deepmind与暴雪今日凌晨公布的《星际争霸2》游戏挑战录像中,以10-1的比分完胜职业玩家。名为“AlphaStar”的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。最后播放的一场比赛中,DeepMind限制了AlphaStar的游戏视角,并在没有测试的前提下与 MANA进行比赛,让人类终于赢了一场。最终总成绩定格在10-1。
2017年底,DeepMind在征服围棋后开始学习星际争霸2。暴雪公司则为DeepMind创造了星际争霸2学习环境(SC2LE)。对于人工智能代理来说,在视频游戏中成功完成多个任务是一个“大挑战”,而且必须保证这些任务同时进行实时平衡。起获胜所需的技能包括博弈论、不完全信息(Imperfect information)、长期规划(Long term planning)、实时性(Real time)和大行动空间(Large action space.)等。