34

新的挑战 阿尔法狗剑指炉石传说

文/距离
评论
导读:据近期一则消息说Google发表了一篇新的论文表示,他们正在教 AlphaGo 按照《炉石传说》和《万智牌》的卡牌编写方法完成代码——简单的说,就是人工智能开始学习玩牌了。
这真是一个可怕的消息,难道现在的计算机都被上古之神腐蚀到丧心病狂了吗?连我们这种小众文化的卡牌游戏都不放过了吗?虽然阿尔法狗现在火的厉害,但是也不一定所有的玩家都知道,毕竟还是有很多人两耳不闻窗外事,一心只打T7猎的。这里简单介绍一下人机大战的历史。 【编辑:大笙爷】

历史上的人机大战

深蓝VS卡斯帕罗夫

1997年,美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫,“深蓝”的运算能力每秒可运算2亿步。

浪潮天梭VS中国象棋五人组

2006年8月9日,首次中国象棋人机大战在北京奥体中心举行,在这次比赛中,“浪潮天梭”同时迎战柳大华、张强、汪洋、徐天红、朴风波5位大师。“浪潮天梭”以每步66万亿次的棋位分析与检索能力,最终以11:9险胜。

阿尔法狗VS 樊麾、李世石

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾。2016年3月,与韩国围棋大师李世石的比赛中4-1大胜。在积分榜上阿尔法狗的分数为3586,排名世界第二。

阿尔法狗的运作流程

计算机是如何能够实现下棋的本领的呢?据道听途说来的消息,1997年,美国IBM公司的“深蓝”超级计算机的运算能力当时在全球超级计算机中居第259位,每秒可运算2亿步。主要依靠强大的计算能力穷举所有路数来选择最佳策略:“深蓝”靠硬算可以预判12步,卡斯帕罗夫可以预判10步,两者高下立现。

中国的超级计算机浪潮天梭的核心机密,这个我是不知道的,知道我也不敢说的,说出来你们也不会相信的,所以我还是不说了。

阿尔法狗的智商和深蓝计算机比起来又更加智能化了。据谷歌的一份PPT显示,阿尔法狗的围棋水平基本上靠自学,通过大量的棋谱进行自我学习和吸收,然后通过自我对局来实现提高和改进,最后形成价值网络,在价值网络的指引下决定落子棋步,这真是一个可怕的过程。听起来似乎这一切都可以自如的运用到炉石传说游戏中来。那么阿尔法狗离统治炉石圈还有多远呢?窃以为阿尔法狗要来炉石圈挑战人类,至少还需要通过这样几道关卡。

第一关:素材

既然阿尔法狗的学习机制需要大量的对局素材,那么学习资料就是阿尔法狗需要面对的第一道关卡。据说阿尔法狗是学习了10万场围棋对局才从中领悟到围棋艺术的精髓,那么阿尔法狗要能够驾驭炉石传说这样一款复杂的卡牌游戏,必定也需要大量的对局素材。而据我们现有的情况看。阿尔法狗并没有这样的素材。因为暴雪爸爸的服务器是不储存对局过程的。而且能够作为阿尔法狗的学习素材的,还应当是高端对局。年轻的炉石传说游戏显然没有这样的资源积累。而且炉石传说的对局比围棋复杂的多,这就是第二个问题了。

第二关:规则

很多时候围棋的棋谱和对局过程,只需要一张图就能够还原,但是炉石传说的对局要更加复杂。棋类游戏一般都是你一步,我一步,轮流走棋或者落子。但是炉石传说却可以在一个回合做很多事情,而且彼此之间还有顺序甚至位置的关系。每张牌的功能都不一样,每张牌的功能是否得到了发挥也都是问题,如何准确有效的掌握游戏规则和阅读比赛记录,这也是阿尔法狗所正在面对的问题。因为有消息说阿尔法狗在理解卡牌描述的时候,遇到了不少问题。

第三关:稳定

就算阿尔法狗经过长期的学习,逐渐解决了上述的两个问题,那么第三个问题将会让阿尔法狗抓狂,那就是朝令夕改的游戏规则。围棋这个游戏经过了3000多年的演化,游戏规则简单而稳定,但是炉石传说的游戏规则不仅复杂,而且还多变。年轻的炉石传说几乎每过两三个月就要修改一下游戏规则,不仅仅是通过冒险模式和资料片对卡牌进行增补,还包括对卡牌的调整和削弱,比如战歌指挥官和秃鹫的修改。即使只有一张牌的修改,就是对之前无数学习资料的否定。而要重新建立学习成果,就又需要大量的对局素材,等到新的对局素材足够丰富的时候,游戏规则毫无悬念的再次修改了。除非阿尔法狗能够适应这种频繁的卡牌修改,并且减少对其之前无数学习过程的影响。

第四关:暗牌

炉石传说和围棋游戏有一个巨大的差异在于,围棋是一个明牌游戏,而炉石传说则是明暗相结合的游戏,你无法知道对手的牌库有什么牌,无法知道对手的手上有什么牌,无法知道对方的奥秘是什么,但是你确实又可以获得一些信息,比如你可以知道对手牌库和手牌的数量,可以知道场面上的所有情况。电子智能是否能适应这样的游戏规则,如何应对这种复杂的情况,都是摆在阿尔法狗面前的新的难题。

第五关:随机

炉石传说作为一个卡牌游戏,有着无法掌控的随机性,即使阿尔法狗本身也是一台计算机,也不能够掌控发牌员和飞刀。这是两个独立的系统,我们人类和阿尔法狗都要接受飞刀和小鬼爆破的结果。不同随机性的结果将会带来完全不同的结果,也就是说,即时在自己的回合,也无法实现对场面的控制。随机性的存在,让阿尔法狗的计算量大大增加,想通过计算能力来碾压人类的难度明显提高。

第六关:黑科技

炉石传说中因为手牌信息的不对称,随机性的普遍存在,使得黑科技成为游戏魅力的一部分,看似平淡无奇的拉锯对局中,说不定就冒出一个四力代火车王的杀手锏。这是以稳健作为第一要务的阿尔法狗所要面对的最困难的情况。如果你每次都要堤防最强黑科技的斩杀,那么你已经输了,如果你不防黑科技的话,那么你将输的更惨。如何选择性的预防可能存在的斩杀情况,是选择稳健防守还是激进进攻,这将是对阿尔法狗价值体系的最大考验。

阿尔法狗的优势

当然,阿尔法狗作为一台计算功能无比强大的计算机,还是有很多地方比起人类有着巨大的优势。首先是对几率的精确计算和对局信息的全面掌控。衡量一个炉石传说牌手的水平高低,很大程度上就是对几率的计算能力和对牌面信息的分析能力,知道摸每一张牌的概率,然后再根据这个概率来决定当下的行动。阿尔法狗可以准确的知道每一张牌在几个回合之内到手的几率,这个说法比较拗口,咱们来举个例子,德鲁伊的牌库中有2张野性成长、2张知识古树、1张豹骑士、2张激活等卡牌,要问5回合内摸到野性成长或者激活或者豹骑士,然后打出知识古树的概率,这个数字是随着每一回合的抽牌情况不断改变的。这对人类来说,要准确知道每一张牌的抽取几率和推测3个回合之后几率几乎是不可能的事情,但是计算机却可以通过排列组合和强大的计算能力洞察一切。能够准确的在对决中记住每一次行动,并且把所有的数据置入一个价值体系中去分析评价,然后得出一个获胜概率最大的行动方案。这种综合分析能力也是所有职业牌手所梦寐以求的。但是对阿尔法狗来说,一切都易如反掌。

阿尔法狗的命门

如何战胜阿尔法狗。阿尔法狗作为电子智能,必然也有其弱点,在阿尔法狗的对决中,5-0横扫欧洲棋手樊麾,4-1大胜韩国棋手李世石。可谓战绩显赫,但是其中毕竟还有一场比赛输掉了。而且据很多围棋大师在分析解读阿尔法狗的对局过程的时候,也发现了阿尔法狗很多时候的棋步有着明显的问题,可见阿尔法狗也有其局限性存在。这可能就是它在价值网络体系中的弱点,只要能够抓住这个弱点,那么阿尔法狗就逃不过人类的打狗棒。

往期回顾

更多>>>
TOP