AI 打星际取重大进步 DeepMind暴雪发神秘预告(2)
时间:2019-01-23 18:35 来源:百度新闻 作者:巧天工 点击:次
去年9月,腾讯AI Lab发布论文称,他们构建的AI首次在完整的虫族VS虫族比赛中击败了星际2的内置机器人Bot。虽然不是严格意义上的“自学”,AI还高度依赖人为归纳的信息,但迄今为止,这是我们在星际2项目上见到的最有建树的成果之一。 腾讯实际上开发了两个AI,基于扁平化动作结构的深度强化学习智能体TStarBots1,和基于分层动作结构规则控制器的智能体TStarBots2。 这两个AI都能在完整对战中击败等级1~10的游戏内置机器人(1v1虫族对抗,地图:深海暗礁),其中等级8、等级9和等级10的机器人都是作弊级AI,它们享有额外的视野和晶体矿、气矿资源。 TStarBots1拥有一系列扁平化的大型操作,在这个基础上,它用强化学习训练智能体采取策略;而TStarBots2的操作控制也是人为编码的,但它有可以自行组合的大型、小型混合层次化操作集。 另外去年11月,塔尔图大学也开源发布了星际2深度强化学习(DRL)智能体Reaver。这种模块化的框架主要用于训练星际2的各种任务,提供比大多数开源解决方案更快的单机环境并行化能力。 Reaver可适应多种环境,除了用于星际2的SC2LE外,还支持其他强化学习任务上常用的Gym、Atari和Mujoco。它用简单的Keras模型来定义神经网络,配置和共享配置也非常方便。 最重要的是,Reaver的训练规模亲民到爆炸。在普通的4核CPU的笔记本电脑上,每秒采样率可以达到5K,10秒内就能学会那个立杆子的游戏CartPole-0。 实际上,还有一批人在研究如何用AI攻克星际(不是星际2)。 如果你感兴趣,可以看看我们此前的报道,这里不赘述了。 最后,附上直播地址,别忘了定闹钟哦~ Twitch上的星际频道: DeepMind的YouTube: |