AI 打星际取重大进步 DeepMind暴雪发神秘预告(2)_电竞之家

　　去年9月，腾讯AI Lab发布论文称，他们构建的AI首次在完整的虫族VS虫族比赛中击败了星际2的内置机器人Bot。虽然不是严格意义上的“自学”，AI还高度依赖人为归纳的信息，但迄今为止，这是我们在星际2项目上见到的最有建树的成果之一。

　　腾讯实际上开发了两个AI，基于扁平化动作结构的深度强化学习智能体TStarBots1，和基于分层动作结构规则控制器的智能体TStarBots2。

　　这两个AI都能在完整对战中击败等级1~10的游戏内置机器人（1v1虫族对抗，地图：深海暗礁），其中等级8、等级9和等级10的机器人都是作弊级AI，它们享有额外的视野和晶体矿、气矿资源。

　　TStarBots1拥有一系列扁平化的大型操作，在这个基础上，它用强化学习训练智能体采取策略；而TStarBots2的操作控制也是人为编码的，但它有可以自行组合的大型、小型混合层次化操作集。

AI 打星际取重大进步 DeepMind暴雪发神秘预告

　　另外去年11月，塔尔图大学也开源发布了星际2深度强化学习（DRL）智能体Reaver。这种模块化的框架主要用于训练星际2的各种任务，提供比大多数开源解决方案更快的单机环境并行化能力。

　　Reaver可适应多种环境，除了用于星际2的SC2LE外，还支持其他强化学习任务上常用的Gym、Atari和Mujoco。它用简单的Keras模型来定义神经网络，配置和共享配置也非常方便。

　　最重要的是，Reaver的训练规模亲民到爆炸。在普通的4核CPU的笔记本电脑上，每秒采样率可以达到5K，10秒内就能学会那个立杆子的游戏CartPole-0。

　　实际上，还有一批人在研究如何用AI攻克星际（不是星际2）。

　　如果你感兴趣，可以看看我们此前的报道，这里不赘述了。

AI 打星际取重大进步 DeepMind暴雪发神秘预告

　　最后，附上直播地址，别忘了定闹钟哦~

　　Twitch上的星际频道：
https：//www.twitch.tv/starcraft

　　DeepMind的YouTube：
https：//www.youtube.com/c/deepmind

(责任编辑：波少)