QQ群：429667613

第34期

新的挑战阿尔法狗剑指炉石传说

文/距离

导读：据近期一则消息说Google发表了一篇新的论文表示，他们正在教 AlphaGo 按照《炉石传说》和《万智牌》的卡牌编写方法完成代码——简单的说，就是人工智能开始学习玩牌了。
这真是一个可怕的消息，难道现在的计算机都被上古之神腐蚀到丧心病狂了吗？连我们这种小众文化的卡牌游戏都不放过了吗？虽然阿尔法狗现在火的厉害，但是也不一定所有的玩家都知道，毕竟还是有很多人两耳不闻窗外事，一心只打T7猎的。这里简单介绍一下人机大战的历史。【编辑：大笙爷】

【17173专稿，未经授权请勿转载】

历史上的人机大战

深蓝VS卡斯帕罗夫

1997年，美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫，“深蓝”的运算能力每秒可运算2亿步。

浪潮天梭VS中国象棋五人组

2006年8月9日，首次中国象棋人机大战在北京奥体中心举行，在这次比赛中，“浪潮天梭”同时迎战柳大华、张强、汪洋、徐天红、朴风波5位大师。“浪潮天梭”以每步66万亿次的棋位分析与检索能力，最终以11：9险胜。

阿尔法狗VS 樊麾、李世石

阿尔法围棋(AlphaGo)是一款围棋人工智能程序，由位于英国伦敦的谷歌(Google)旗下DeepMind公司开发，这个程序利用“价值网络”去计算局面，用“策略网络”去选择下子。2015年10月阿尔法围棋以5：0完胜欧洲围棋冠军、职业二段选手樊麾。2016年3月,与韩国围棋大师李世石的比赛中4-1大胜。在积分榜上阿尔法狗的分数为3586，排名世界第二。

阿尔法狗的运作流程

计算机是如何能够实现下棋的本领的呢?据道听途说来的消息，1997年，美国IBM公司的“深蓝”超级计算机的运算能力当时在全球超级计算机中居第259位，每秒可运算2亿步。主要依靠强大的计算能力穷举所有路数来选择最佳策略：“深蓝”靠硬算可以预判12步，卡斯帕罗夫可以预判10步，两者高下立现。

中国的超级计算机浪潮天梭的核心机密，这个我是不知道的，知道我也不敢说的，说出来你们也不会相信的，所以我还是不说了。

阿尔法狗的智商和深蓝计算机比起来又更加智能化了。据谷歌的一份PPT显示，阿尔法狗的围棋水平基本上靠自学，通过大量的棋谱进行自我学习和吸收，然后通过自我对局来实现提高和改进，最后形成价值网络，在价值网络的指引下决定落子棋步，这真是一个可怕的过程。听起来似乎这一切都可以自如的运用到炉石传说游戏中来。那么阿尔法狗离统治炉石圈还有多远呢?窃以为阿尔法狗要来炉石圈挑战人类，至少还需要通过这样几道关卡。

第一关：素材

既然阿尔法狗的学习机制需要大量的对局素材，那么学习资料就是阿尔法狗需要面对的第一道关卡。据说阿尔法狗是学习了10万场围棋对局才从中领悟到围棋艺术的精髓，那么阿尔法狗要能够驾驭炉石传说这样一款复杂的卡牌游戏，必定也需要大量的对局素材。而据我们现有的情况看。阿尔法狗并没有这样的素材。因为暴雪爸爸的服务器是不储存对局过程的。而且能够作为阿尔法狗的学习素材的，还应当是高端对局。年轻的炉石传说游戏显然没有这样的资源积累。而且炉石传说的对局比围棋复杂的多，这就是第二个问题了。

第二关：规则

很多时候围棋的棋谱和对局过程，只需要一张图就能够还原，但是炉石传说的对局要更加复杂。棋类游戏一般都是你一步，我一步，轮流走棋或者落子。但是炉石传说却可以在一个回合做很多事情，而且彼此之间还有顺序甚至位置的关系。每张牌的功能都不一样，每张牌的功能是否得到了发挥也都是问题，如何准确有效的掌握游戏规则和阅读比赛记录，这也是阿尔法狗所正在面对的问题。因为有消息说阿尔法狗在理解卡牌描述的时候，遇到了不少问题。

第三关：稳定

就算阿尔法狗经过长期的学习，逐渐解决了上述的两个问题，那么第三个问题将会让阿尔法狗抓狂，那就是朝令夕改的游戏规则。围棋这个游戏经过了3000多年的演化，游戏规则简单而稳定，但是炉石传说的游戏规则不仅复杂，而且还多变。年轻的炉石传说几乎每过两三个月就要修改一下游戏规则，不仅仅是通过冒险模式和资料片对卡牌进行增补，还包括对卡牌的调整和削弱，比如战歌指挥官和秃鹫的修改。即使只有一张牌的修改，就是对之前无数学习资料的否定。而要重新建立学习成果，就又需要大量的对局素材，等到新的对局素材足够丰富的时候，游戏规则毫无悬念的再次修改了。除非阿尔法狗能够适应这种频繁的卡牌修改，并且减少对其之前无数学习过程的影响。

第四关：暗牌

炉石传说和围棋游戏有一个巨大的差异在于，围棋是一个明牌游戏，而炉石传说则是明暗相结合的游戏，你无法知道对手的牌库有什么牌，无法知道对手的手上有什么牌，无法知道对方的奥秘是什么，但是你确实又可以获得一些信息，比如你可以知道对手牌库和手牌的数量，可以知道场面上的所有情况。电子智能是否能适应这样的游戏规则，如何应对这种复杂的情况，都是摆在阿尔法狗面前的新的难题。

第五关：随机

炉石传说作为一个卡牌游戏，有着无法掌控的随机性，即使阿尔法狗本身也是一台计算机，也不能够掌控发牌员和飞刀。这是两个独立的系统，我们人类和阿尔法狗都要接受飞刀和小鬼爆破的结果。不同随机性的结果将会带来完全不同的结果，也就是说，即时在自己的回合，也无法实现对场面的控制。随机性的存在，让阿尔法狗的计算量大大增加，想通过计算能力来碾压人类的难度明显提高。

第六关：黑科技

炉石传说中因为手牌信息的不对称，随机性的普遍存在，使得黑科技成为游戏魅力的一部分，看似平淡无奇的拉锯对局中，说不定就冒出一个四力代火车王的杀手锏。这是以稳健作为第一要务的阿尔法狗所要面对的最困难的情况。如果你每次都要堤防最强黑科技的斩杀，那么你已经输了，如果你不防黑科技的话，那么你将输的更惨。如何选择性的预防可能存在的斩杀情况，是选择稳健防守还是激进进攻，这将是对阿尔法狗价值体系的最大考验。

阿尔法狗的优势

当然，阿尔法狗作为一台计算功能无比强大的计算机，还是有很多地方比起人类有着巨大的优势。首先是对几率的精确计算和对局信息的全面掌控。衡量一个炉石传说牌手的水平高低，很大程度上就是对几率的计算能力和对牌面信息的分析能力，知道摸每一张牌的概率，然后再根据这个概率来决定当下的行动。阿尔法狗可以准确的知道每一张牌在几个回合之内到手的几率，这个说法比较拗口，咱们来举个例子，德鲁伊的牌库中有2张野性成长、2张知识古树、1张豹骑士、2张激活等卡牌，要问5回合内摸到野性成长或者激活或者豹骑士，然后打出知识古树的概率，这个数字是随着每一回合的抽牌情况不断改变的。这对人类来说，要准确知道每一张牌的抽取几率和推测3个回合之后几率几乎是不可能的事情，但是计算机却可以通过排列组合和强大的计算能力洞察一切。能够准确的在对决中记住每一次行动，并且把所有的数据置入一个价值体系中去分析评价，然后得出一个获胜概率最大的行动方案。这种综合分析能力也是所有职业牌手所梦寐以求的。但是对阿尔法狗来说，一切都易如反掌。

阿尔法狗的命门

如何战胜阿尔法狗。阿尔法狗作为电子智能，必然也有其弱点，在阿尔法狗的对决中，5-0横扫欧洲棋手樊麾，4-1大胜韩国棋手李世石。可谓战绩显赫，但是其中毕竟还有一场比赛输掉了。而且据很多围棋大师在分析解读阿尔法狗的对局过程的时候，也发现了阿尔法狗很多时候的棋步有着明显的问题，可见阿尔法狗也有其局限性存在。这可能就是它在价值网络体系中的弱点，只要能够抓住这个弱点，那么阿尔法狗就逃不过人类的打狗棒。

栏目策划

往期回顾

更多>>>

槽炉石：卡拉赞天台上的朋友到底是谁?

槽炉石：卡拉赞天台上的朋友到底是谁?[详细]
槽炉石：卡拉赞之谜 BOSS聚会少了谁

槽炉石：卡拉赞之谜 BOSS聚会少了谁[详细]
槽炉石：卡拉赞之谜系列鱼人去哪儿了

槽炉石：卡拉赞之谜系列鱼人去哪儿了[详细]

新的挑战 阿尔法狗剑指炉石传说

历史上的人机大战

阿尔法狗的运作流程

阿尔法狗的优势

阿尔法狗的命门

栏目策划

往期回顾

槽炉石：卡拉赞天台上的朋友到底是谁?

槽炉石：卡拉赞之谜 BOSS聚会少了谁

槽炉石：卡拉赞之谜系列 鱼人去哪儿了

新的挑战阿尔法狗剑指炉石传说

槽炉石：卡拉赞之谜系列鱼人去哪儿了