您当前的位置: 首页 > 科技网络

扑克人机大战,人类胜算只有10%?

2017-05-11 00:01:51

  AI风暴再次来袭。6日开始,卡内基梅隆大学知名扑克机器人Libratus将化身“冷扑大师”,与中国“龙之队”在海南展开为期5天、长达45小时的扑克人机大战。主办方在5日的赛前发布会上宣布,获胜1方将取得200万元表演赛嘉奖。

  “冷扑大师”是卡内基梅隆大学开发的无穷德州扑克人工智能系统。今年1月,它击败了人类顶尖玩家。在这次比赛中,每当这些玩家发出1个动作,它就会被传送到卡内基梅隆大学的计算机服务器上。

  中国“龙之队”华人顶尖牌手由2016年世界扑克大赛金手链冠军得主杜悦领军。杜悦估计,虽然“冷扑大师”是目前扑克界最强的人工智能,但人类顶尖牌手仍有10%的胜率。

  创新工场CEO暨人工智能工程院院长李开复之所以发起这场扑克人机对战,和他1988年在母校卡内基梅隆大学开发“奥赛罗”的经历息息相干,后者成为第1个击败黑白棋世界冠军的人机对弈系统。

  “德州扑克是创投圈人士爱玩的1项活动,AI更是创投圈最近几年来关注的重点,这次活动对AI的宣扬和推动将起到重要作用。”赛事协办方春光里运营总监董冬则告知科技日报记者。“我固然希望人类能赢,但‘冷扑大师’毕竟曾打败过美国顶尖的德扑选手。”董冬说。

  人工智能专家1直将这些游戏作为开发和测试的工具,在此之前,计算机已在国际象棋、西洋双陆棋中击败了人类,去年的AlphaGo更是名声大噪。“扑克则有些不同,由于你不知道你的对手拿的是甚么牌。”作为德州扑克爱好者,董冬分析。

  谈到与围棋比赛、AlphaGo的不同,李开复表示,德州扑克更接近人性,由于信息是有隐藏的,牌手可以诚实或欺骗地表达。这些种种的斟酌,更像是人与人之间的商业、外交博弈,“冷扑大师”的技术都与这些因素相干。

  通过对手的动作表情判断对手牌的强弱,是德州扑克相当重要的1种游戏技能,而“冷扑大师”作为1个冷冰冰的人工智能系统,如何应对人类棋手复杂的心理战呢?

  对此,李开复表示,对“冷扑大师”来讲,心理战实际上是基于1个优化结果最大化的1个计算,它计算该怎样去做才能得到最多的积分牌。他说,扑克机器人的研发基于博弈论,并且结合了大量的数学和几率理论,扑克程序在赛前不曾研拟历史牌谱,直接在比赛同时动态优化胜率最高的数学模型,利用战略推理揭穿玩家底牌的隐藏信息,从而建构出智能化的AI谈判策略套路。在技术研发的背后,其实电脑其实不对人类玩家的心理战术进行任何摹拟或分析,反倒以博弈论加上大量数学打败了顶尖牌手。

  卡内基梅隆大学计算机学院院长安得烈·穆尔教授则认为,“冷扑大师”表面显现的是扑克,背后实际是1个大型的谈判算法。扑克AI并没有用到神经网络和机器学习这两种技术,而是用了比较古典的线性计划。

  李开复认为,当今这套人工智能扑克程序背后的模型,将适用于需要用到战略推理和多方谈判的场景。从企业谈判、商务谈判、外交谈判、乃至到生活方面的房屋买卖谈判,10年内都将会部份或全面被人工智能所取代。(操秀英)

TAG:
推荐阅读
图文聚焦