广告位API接口通信错误,查看德得广告获取帮助

电竞之家_品味电竞生活移动版

主页 > 刀塔2 >

2:0战胜Dota2世界冠军OG,OpenAI发起全网挑战,不服来战!(2)

  2018 年6 月时,OpenAI Five 也成功以5v5 的形式将半职业的人类队伍给击败,这5 位分别是半职业选手以天梯分数来看平均都在6500 以上,天梯排名最低也有1000 名左右。

  时间往后推到 2018 国际锦标赛,OpenAI Five 以辗压半职业队伍的声势浩浩荡荡的准备开始挑战职业队伍。好景不常的是,第一场挑战赛是早已被淘汰的前 18 强巴西队伍 paiN Gaming,在这场挑战赛中 OpenAI Five 中期虽然重新获得优势,但最后还是输给身为职业的玩家。

  第二场挑战赛的对手是中国的五位名人堂选手:Burning(徐志雷)、Ferrari.430(骆非池)、xiao8(张宁)、sansheng(王兆辉)、rOtk(白帆)几乎都是战绩辉煌的中国《Dota 2》老将。当时比赛进行道最后45分钟的时候,人类打爆遗迹,获得胜利。

  OpenAI为何如此钟情游戏

  OpenAI并不只是想在DOTA中击败专业队伍,而是在学习如何通过做上千个小决定来达成更大的终极目标。例如,OpenAI就在另外一个项目中再次使用了和Dota 2机器人相同学习系统与算法:研究人员设计了一个算法来控制机械手握住一个积木,并且用机械手的指头来操控它指向一个特定的方向。

  尽管OpenAI用相似的代码来训练游戏人工智能和机器人,一个重要的区别在于他们是分别在各自学习如何完成任务。你想让Dota 2机器人来控制一只手是不可能的:算法总体来说是可以同时学习多个技能的,但这种跨度大、毫不相关的技能还是不行的。

  OpenAI的Rapid强化学习系统并非是第一个为了电子游戏而开发进而应用到真实世界的技术。比如蒙特卡洛树搜索是一个十几年前为了下围棋而开发的算法,现在被应用于规划和优化类的任务。欧洲太空总署运用了这一算法来规划太空探测器的星际轨迹,它也是2016年DeepMind的AlphaGo击败世界冠军李世石的算法支柱。

  蒙特卡洛树搜索论文链接:

  https://www.aaai.org/Papers/AIIDE/2008/AIIDE08-036.pdf

  实习/全职编辑记者招聘ing

  加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn

(责任编辑:波少)
广告位API接口通信错误,查看德得广告获取帮助