正在阅读:星际争霸2游戏25日人工智能AlphaStar比赛详解星际争霸2游戏25日人工智能AlphaStar比赛详解

2019-01-30 10:38 出处:其他 作者:佚名 责任编辑:lixianmei

    《星际争霸2》在近期举办了一场由人工智能与人类的游戏比赛,由于时差关系,本次的比赛许多人无法观看直播,下面就为大家带来具体的战报详解。

    笔者在凌晨全程直播了本次人类与AlphaStar对决的比赛过程,并在本文中精编出本次直播中的一些重要内容,供大家快速了解。

    [直播内容速记]

    1. DeepMind一共研究出了多款AlphaStar,这些AlphaStar最先通过研究上百万份《星际争霸2》玩家天梯录像来学习,接着再通过一种“AlphaStar联赛”的互相训练方式来学习。

    2. 今天展示的AlphaStar此前进行了一周的自我对练学习,其中最强的一款AlphaStar在一周内的练习量相当于人类200年的练习量,这一点和围棋的AlphaGo很像。

    3. DeepMind团队并没有明确表示AlphaStar是否在自己创造打法,但可以肯定的是在之前的学习中,他们一直让AlphaStar在模仿人类的打法、战术和反制战术。

    4. 在多款AlphaStar中因为学习过程的差异,形成了不同难度不同战术风格的分级。

    5. 在当天的直播中,共展示出了三款不同的AlphaStar,根据特点可以描述为“普通型”、“操作超越人类胜利极限型”和“拟人化型”。

    6. AlphaStar的反应速度300毫秒,其实比人还慢。

    7. 直播中的比赛地图和种族对抗都局限在了一种情况下,DeepMind表示选择局限在PvP(神族vs神族)对抗是因为这一种族对抗是相对比较流程固定的对抗,易于技术入手。

    8. 直播中公开的所有人类与AlphaStar的对局游戏录像文件都已经在DeepMind官网上开放下载。

    9. 在直播结束后,笔者与一位国内同样进行星际争霸人工智能研发的人士进行了一些相关知识的问答,将会写在本文最后。

    10. 比赛场间,AlphaStar的第一视角放出,与人类相比,操作方式大致一样。同时被演示出的还有AlphaStar的神经网络示意图,AlphaStar的逻辑为以当前屏幕范围内的原始观测为出发点,通过神经网络来分析和判断空间、优劣势以及下达建造生产等指令。

    11.在第一场TLO和AlphaStar的五场对决中,TLO使用了他不擅长的种族神族,而他的神族只有中等业余玩家的水平。在第二场MaNa和AlphaStar的五场录像对决中,MaNa使用了他最擅长的神族,而他的对手AlphaStar则使用了“操作超越人类极限型”。

    12.即使“操作超越人类极限型”的AlphaStar的操作是人类几乎无法实现的,但仍然使用了限制APM(每分钟操作数,可理解为手速)的规则,这与大家理解的“脚本操作”是有本质区别的。

    13.AlphaStar并没有编队。

    14.AlphaStar也会有和人一样的操作失误,比如误伤到自己部队,不小心打自己的建筑。

    15. 三款AlphaStar都会作出一些人类不太理解的选择。

    16.AlphaStar会使出一些干扰对手的小操作,在一场对决中,“操作超越人类极限型”AlphaStar甚至使用了农民紧贴气矿来干扰对手建造气矿的干扰小操作。

    17.“操作超越人类极限型”AlphaStar在比赛中拥有学习调整能力,在与MaNa的五场比赛中,他一直在学习进步优化一些细节。

    18.有趣的是,人类也在对决中尝试向AlphaStar学习来改进自己以及适应对手的打法。

    19.无论哪款AlphaStar,都会使用不同的开局和战术,“操作超越人类极限型”AlphaStar甚至使用了前置不朽者的大招,并击败了人类。

    20.“操作超越人类极限型”AlphaStar在与MaNa的一场对决中用一系列漂亮的三线追猎拉扯操作逆转了比赛,这一系列操作人类几乎无法完成,他需要人类的应激反应和操作容错和杜绝受迫性达到极致,但总结一句,这一系列操作人类基本无法达到,用他的对手MaNa的原话说:“我当时都以为我已经赢了。”

    人类几乎无法完成的三线完美拉扯操作

    21.中国的神族职业选手MacSed认为三款AlphaStar的运营能力比人类职业选手还强,通俗的说,AlphaStar的执行能力近乎机器人,他们不会有失误,不会有遗忘。

    22.MacSed认为AlphaStar已经有了战术判断、宏观大局分析能力。

    23.MacSed认为AlphaStar在游戏中距离感、走位判断、兵感(决战前判断能不能打赢)等这种较抽象化、概念化的判断能力已经明显强于人类。

    24.AlphaStar很喜欢使用“追猎者”这个兵种,而大多数神族玩家觉得这个兵种很弱。AlphaStar钟爱“追猎者”可能是因为它们有着非常大的操作上限。

    25.总体来说,AlphaStar的在对决中使用的战术或者兵种组合并不完全镜像职业比赛,但有些似乎不无道理。

    26. AlphaStar为目前的星际2提供了一些新的战术理解吗?有,但以人类的能力驾驭不了。

    27.在一些数据处理不是很直观的情况下,AlphaStar的一些选择还不太合理或是显得死板。比如纠结于一个小路口而不是选择绕路选择一个更开阔的路口进攻。

    28.目前AlphaStar的强项仍然是操作,而非拥有一定逻辑能力的局势分析和战术创造,但并不代表现在他们没有这个能力。

    和人类职业选手一样华丽的操作

    29. 总体来说,AlphaStar目前的研发状态和展现出的技战术水平已经非常成熟,就今天的效果来看,未来战胜最强的星际2职业选手不无可能,且恐怕已经为期不远。

    30. 在直播结尾,DeepMind提到,AlphaGo通过围棋战胜人类是人工智能AI的一个里程碑。但人类之所以为人类,就是能从不同结果中学习,DeepMind希望找出能和人类一样的自我学习算法。这个长期的计划对于人类在未来意义重大。

   

  比赛详解

    [直播过程简述]

    在开场时,两位星际2的著名解说Artosis与RotterdaM以及谷歌人工智能团队的科研人员Oriol Vinyals、《星际争霸2》首席制作人Tim Morten简单为大家介绍了关于AlphaStar技术原理以及选择《星际争霸2》作为DeepMind团队研发目标的原因(后文会有详细记录)。

    随后,德国虫族职业选手TLO和波兰神族职业选手MaNa先后被请上台,现场播放并讲解了不久前在DeepMind总部与三款难度不同的AlphaStar对决的比赛录像。

    在此前两位选手对决的共10场比赛录像中暴雪分别选取了2场进行现场直播回放,并公开了最终的结果:人类未尝一胜。

    这时在现场的职业选手MaNa表示想再次挑战AlphaStar,现场进行了一场表演赛。在现场表演赛中MaNa的对手AlphaStar与之前的录像中并非同一款,并最终取得了胜利。

    [比赛过程]

    第一局比赛:TLO与AlphaStar五场对决的第一场比赛。AlphaStar使用了人类比赛中最常规的2兵营开局,但建造顺序略有瑕疵。AlphaStar开局并没有像主流一样选择堵口建筑学。

    AlphaStar在前期使用了和人类一样的飘使徒屠农骚扰。接着使用了单矿2兵营带棱镜压制,这与人类比赛中比较常用的三兵营压制有一些区别。

    AlphaStar在比赛中用出了非常精彩的拉濒死单位以及非常高水平的棱镜接送操作,并最终用单矿战术打死了双矿开局的TLO。

    第二局比赛:AlphaStar使用了PvP对抗中比较常见的自爆球战术,虽然自爆球的比例明显要多于人类。TLO开始寻找AlphaStar的弱点,使用小股部队多线游走牵制,这也给AlphaStar造成了很大的麻烦。但凭借运营上的优势,AlphaStar还是拿下了比赛。

    第三局比赛:另一款AlphaStar迎战另一位职业选手MaNa。AlphaStar在开局使用了前置野4兵营一波战术。MaNa在侦查到的情况下由于抉择的失误以及AlphaStar近乎完美的追猎操作,被一波击倒。

    第四局比赛:AlphaStar使用5兵营爆追猎的战术,这在职业比赛中是没有见过的。MaNa在家里出不朽防守,但AlphaStar通过在人类看来几乎完美的闪追操作一直在给MaNa压力。

    在MaNa攒出足够多的不朽后选择出门反打,但在地图中间AlphaStar把自己的追猎部队分割成了三路,通过三线完美的闪追游击完美化解MaNa的反攻,这一通过操作的逆转在人类的认知范围里是不可能完成的。

    现场表演赛:AlphaStar使用3先知开局牵制MaNa同时三开运营。一直被先知屠杀农民在运营处于劣势的MaNa选择棱镜空投不朽反骚扰牵制。AlphaStar对于停留在地面部队无法攻击到的位置的棱镜陷入了困境

    所有部队在原地打转,MaNa抓住机会一波进攻,没有之前那款那么变态操作的AlphaStar被一波推平。

    以上就是具体的比赛战报介绍,玩家可以进行参考!

星际争霸2系列软件最新版本下载
星际争霸2电脑版软件版本:1.0手游电脑版立即查看
星际争霸2软件版本:1.0Android游戏立即查看

关注我们

最新资讯离线随时看 聊天吐槽赢奖品