微软麻将AI来了!第一波人类高手已经被打爆

微软麻将AI来了!第一波人类高手已经被打爆


内功修炼到了十段,微软打算让Suphx出来走两步。

今年6月,由微软亚洲研究院开发的麻将AI系统Suphx成为首个在国际专业麻将平台“天凤”上荣升十段的AI系统,这是目前AI系统在麻将领域取得的最好成绩,其实力超越该平台公开房间顶级人类选手的平均水平。

今天,微软首次对外正式披露了该项目的详细进展,这个项目由微软亚洲研究院副院长刘铁岩带队的四人团队组成,用时一年,成绩显著。

大家可能有很多疑问,麻将AI和我们熟知的围棋AI有哪些不同?都是人工智能那谁更厉害?麻将AI又能做什么?网易智能同微软团队进行了深入的交流。

他们为什么选择麻将!

实际上,打造麻将AI要比打造已经压制人类的谷歌围棋AI难度更大。因为如果是围棋,棋局信息是公开的,但对于麻将而言,有太多的隐藏信息,并且有更多的随机性。

换句话讲,麻将这类非完美信息游戏,与围棋、象棋等完美信息游戏相比,对人工智能来说具有更大的挑战性,如果说围棋的可观测状态信息是10的172次方,隐藏的不确定信息为0,那么,麻将的可观测状态信息则是10的121次方,可怕的是隐藏的不确定信息达到了10的48次方。

微软麻将AI来了!第一波人类高手已经被打爆


刘铁岩向网易智能表示,我们生活的世界是由许许多多的随机事件构成的,而且在很多情况下,无法知晓的信息也许远多于我们能够掌握的信息,而我们仍然要在这样信息不完全的条件下做出大大小小的决策。

“AI在非完美信息游戏中的突破,将有助于协助人类应对更多高度复杂的现实问题,尤其是在智能交通、金融投资等容易受到随机突发状况影响的场景中“。他谈到。

AI如何在天凤“打怪升级”

据介绍,由于长期在民间广为流传,不同地区的麻将玩法非常多样,缺乏统一的规则标准和评价体系。日本在线麻将竞技平台“天凤”,因其完善的竞技规则、专业的段位体系,成为专业麻将平台,受到职业麻将界的广泛承认。

刘铁岩介绍,天凤平台为高水平麻将玩家提供两种竞技房间:“特上房”对四段以上所有玩家免费开放,允许AI参与游戏,目前所有玩家在此房间的最高段位是十段;

“凤凰房”仅对七段以上的人类付费玩家开放,目前不允许AI参与游戏,在该房间能够达到的最高段位是十一段,称为“天凤位”。自天凤平台在2006年推出以来,全平台达到四人麻将天凤位的麻将高手仅有13位[JL1] ,曾经达到过十段的选手约有180位,而现役十段的人类选手也仅有十几位。

而微软亚洲研究院开发的麻将AI系统Suphx于3月登陆天凤平台,在AI能够参与的公开竞技房“特上房”,Suphx与人类选手展开了5000余场四人麻将对局,在这5000余场对局中,Suphx的稳定段位超过了8.7。

刘铁岩透露,他们也在和天凤平台探讨,以怎样的方式让Suphx进入还不允许AI参与的凤凰房。

麻将AI到底难在哪?

与象棋、围棋、德州扑克等棋牌类游戏相比,麻将具有更复杂的隐藏信息和更高的难度。

总体而言,微软亚洲研究院将麻将AI面临的挑战总结为以下三点:

首先,巨大的状态空间:与只有52张牌的德州扑克相比,136张麻将牌的排列组合可能性更多。同时,麻将中同一个玩家两次出牌之间,夹杂了其他三个玩家的出牌和自己摸的底牌,可能出现的不同局面数目非常巨大。值得特别指出的是,在麻将中,4位玩家的出牌顺序是不固定的,任意一位玩家的“吃碰杠”都可能使出牌顺序突然改变,导致游戏树不规则、且动态变化。这些特点使麻将很难直接利用AlphaGo等棋盘游戏AI常用的蒙特卡洛树搜索算法。

其次,非完美信息博弈:象棋和围棋属于完美信息游戏,玩家可以看到棋局中对方玩家的落子。麻将则存在大量的隐藏信息。具体而言,麻将中每个玩家可以有13张手牌,另外还有84张底牌。对于一个玩家而言,他只知道自己手里的13张牌和之前已经打出来的牌,却无法知道别人的手牌和没有翻出来的底牌,所以最多可以有超过120张未知的牌[JL2] 。这么多的未知信息使得麻将的难度非常高。一方面,由于随机性太大,玩家即便在出牌决策中估计对方玩家手牌、底牌等不可见的牌,也无法避免不确定性对于游戏走向的影响。这将对AI模型的训练带来很大挑战:AI模型很难发现已知牌面信息和最优打法之间的逻辑链路。另一方面,丰富的隐藏信息导致游戏树的宽度非常大,对树搜索算法的可行性提出了进一步的挑战。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://9934qp.com/damajiang/sirenmajiang/2019/1004/2674.html