Top
首页 > 新闻 > 滚动新闻 > 正文

人工智能不只是超级玩家

棋牌游戏对人来说是益智游戏,对人工智能来说,也是其“智力开发”的重要手段。人工智能开发者一直将人类喜闻乐见且具高对抗性的棋牌游戏作为人工智能开发和测试的工具。
发布时间:2017-03-24 15:19        来源:人民邮电报        作者:张力平

棋牌游戏对人来说是益智游戏,对人工智能来说,也是其“智力开发”的重要手段。人工智能开发者一直将人类喜闻乐见且具高对抗性的棋牌游戏作为人工智能开发和测试的工具。

过去20年里,人们见证了许多棋牌游戏在人工智能面前纷纷“沦陷”,如中国象棋软件早已把顶尖棋手玩得团团转,“深蓝”攻陷国际象棋,“阿尔法狗”在与围棋高手的“番棋赛”及连续对战中获胜,最近,又有人工智能系统击败了德州扑克高手……至此,对于大多数棋牌游戏,顶级的人工智能系统都创造了战胜顶级人类大师的纪录。围棋是人类智能的最后堡垒,围棋的变化数比已知宇宙中的原子数还多。围棋不仅算法复杂,而且还更多靠人类特有的宏观感觉,所以被称为棋牌领域的“皇冠”。人工智能能够战胜围棋棋手,可谓登顶成功,而人工智能在德州扑克上的进步,如征服一座奇峰一般,也具有重要意义。

中国象棋、国际象棋和围棋都是“完美信息”游戏,所有玩家在游戏中能获得的确定性信息是公开和对称的,可以看到棋盘上的棋子,并预测落子可能性。在这些棋类游戏的对阵中,人工智能可以凭借自己的计算优势,看到棋盘上的所有棋子,人类玩家的每一步落棋,都能被人工智能计算出所有的可能性。人工智能掌握这些游戏的难度,主要取决于游戏中需要作出的决策点的数量,这决定计算机需要的计算量。人工智能在每一个决策点都能独立地计算出一个最优解。而德州扑克是一种包含很多隐藏信息的“不完美信息”游戏,无法像下围棋一般计算所有下一步的可能性来决策,玩家只掌握不对称的信息,只看得到自己手里的牌,却不知道对手手中是什么牌,不知道五张公共牌会开出怎样的结果,也不知道对手猜测自己握有怎样的手牌。由于人工智能系统不具备欺骗对手和体察对手在欺骗自己这样的人类独具的心理能力,虽然一局德州扑克中的决策点数量要少于一盘围棋,但是这些决策点并不独立,在每一个决策点上,玩家都需要再从全盘进行复杂的推理,这在计算量上是难以想象的,对人工智能更具挑战。

机器学习技术是人工智能进步神速的关键。人工智能开发者并未教人工智能系统如何打扑克,只是告诉它扑克的规则,让它通过几万亿次的自我对战寻找到获胜策略。在运用深度学习、反复自我博弈后,人工智能系统学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的“牌感”,即在当前情境下对个人牌面大小的感觉,并作出相应的决策。人工智能系统应用均衡博弈,通过平衡风险与收益来决定下一步,以达到“完美状态”。开发者还会将其与超级计算机联网改进算法,使之总能在人类对手制衡自己前抢先一步。有意思的是,人工智能玩德州扑克的风格迥异于人类,让人捉摸不透,成为其制胜关键。人工智能还能不断补救战术漏洞,使之更无懈可击。 

无论是在围棋上的“明争”,还是德州扑克上的“暗斗”,人工智能在一次次地震撼人类,在“战胜人类”的道路上衔枚疾走。掌握博弈论的人工智能应用,绝不只是简单地下棋打牌。人类生活中有许多“不完美信息”的场景,人工智能攻克德州扑克后,其未来还能应用在金融、证券、拍卖、政治和商业谈判、军事、网络安全等那些需要人工智能在“不完美信息”的情景中作出决策的领域。以后,凡是需要基于“不完美信息”作出战略决策时,人工智能都可能给出最优解。人工智能的发展速度,正不断刷新行业的预期和人类的认知,催生新的以互联网、大数据、云计算等信息通信技术为核心的行业,帮助人们创新未来。

合作站点
stat