【重磅】DeepMind进军星际争霸2,谷歌Facebook打响通用AI战争(3)
时间:2019-01-27 06:42 来源:百度新闻 作者:巧天工 点击:次
2017年8月7日,Facebook 的四名科学家 Zeming Lin, Jonas Gehring, Vasil Khalidov, Gabriel Synnaeve 公布了史上最大的《星际争霸:母巢之战》游戏数据集:365GB,包含6万游戏记录,15亿帧,4.9亿玩家操作。 Github链接: 在提交的论文中《STARDATA: A StarCraft AI Research Dataset》中,研究者们介绍,他们发布的STARDATA是一个包含了65646条星际争霸游戏记录的数据库,包含了15.35亿帧和4.96亿玩家操作。 “我们提供完整的游戏状态数据以及可以在“星际争霸”中查看的原始重播。游戏状态以每3帧为频次进行记录,确保它们适用于各种机器学习任务,如战略分类,反向强化学习,模拟学习,前向建模,部分信息提取等。我们使用TorchCraft来提取和存储数据,它可以将数据格式标准化,用于从重放中读取和直接从游戏中读取。此外,数据可以在不同的操作系统和平台上使用。数据集只包含了有效的,非损坏的重放,其质量和多样性通过一些启发式来确保。我们用各种统计数据来展示了其数据的多样性,并提供从数据集中受益的任务的例子。” 未来机器人像人一样坐在电脑前,操作鼠标打星际 国内AI 资深专家袁泉此前曾深入研究过星际争霸中的若干AI问题,和UCL共同发表了多智能体协作网络BiCNet,第一次展现了AI在星际微观战斗中的五类智能协作方式。新智元对此做过专门报道。此次DeepMind 和暴雪最新发布的星际争霸 2 AI开放研究平台的论文中,也多次引用了袁泉团队的工作。因此,袁老师应新智元之邀做了特别点评。他指出了此事的两点意义: 第一点:星际 2 的搜索和决策空间比 AlphaGo 围棋大了多个“数量级”,DeepMind、Facebook 等越来越多的优秀团队参与到这项研究中,很可能创造出更好的下一代AI的新技术。因为按之前玩围棋的技术框架的话,蒙特卡罗树搜索加深度强化学习,应该是不能完全解决星际中的问题,尤其是full game智能策略方面的难题。此次DeepMind和暴雪在AI开放平台、API标准化、性能架构上做了不少细致卓越的工作,为今后的研究打下了好的基础,希望国内有志于此方向的老师同学积极投入到此项研究工作中。 第二点: SC2LE 开放平台,相对于大家之前做的星际1的平台,最大的一个优势是提供了很多端到端的内容操作的接口,发展出来可以通过接口像人一样打星际,进行控制,这种接口是在之前的星际1平台上不提供的。基于这一点,未来有可能大家可以会看到机器人像人一样坐在电脑前,操作鼠标打星际和高手对决,对机器人等相关领域也是很好的促进! 人工智能的下一个大考:星际争霸 过去十年 AI 领域取得了巨大进展。借助标签数据监督,机器在一定程度上超过了人类的视觉认知和语音识别能力。同时,单个 AI 单元(又名智能体)在多项游戏中击败了人类,包括 Atari 视频游戏、围棋和德州扑克。 然而,真正的人类智慧包含社会和协作智能,这是实现通用人工智能(AGI)宏伟目标的基础。集体的努力可以解决个体无法解决的问题。即使像蚂蚁这样弱小的个体,当其形成社会组织时,也可以完成例如猎食、修建一个王国甚至发动一场战争这样有高度挑战性的任务。 有趣的是,在即将到来的算法经济时代,在一定程度上具有人工集体智能的 AI 智能体开始在多个领域出现。典型的例子包括股票市场上的交易机器人游戏,广告投标智能体通过在线广告交易平台互相竞争,电子商务协同过滤推荐者通过人群的智慧预测用户兴趣等等。AGI 的下一个重大挑战是回答大规模多个 AI 智能体如何从激励和经济约束共存的环境中吸取经验,学习人类水平的合作或竞争。随着深度加强学习(DRL)的蓬勃发展,研究人员开始借助增强后的学习能力,着手解决多代理协作问题。 Fortune报道称,DeepMind的目标是让计算机击败最顶级的人类星际争霸玩家。“这样的胜利将是人工智能的重大突破,但由于掌握游戏所需的复杂性,这可能还需要很长的时间。虽然DeepMind已经成功地创建了在玩经典Atari游戏时表现非常出色的AI软件,但星际争霸却带来了更加困难的挑战。” Fortune的报道还说,DeepMind CEO Demis Hassabis 2017年5月在乌镇围棋峰会上曾表示, 他的团队认为,星际争霸是推动人工智能进步的一个大考验。 (责任编辑:波少) |