由卡耐基梅隆大學(CMU)開拓的“Libratus”人工智能(AI)系統將開始一場新的挑戰:試圖在一對一、無限制投注的“無限注德州撲克”(No-Limit Texas Hold'em)角逐中挑戰人類頂級職業玩家,得勝者將得到20萬美元的獎金。
卡耐基梅隆大學研究人員暗示,但愿Libratus最終可以或許贏得角逐,這樣他們就可以首次向全世界公布:人工智能又攻陷了德州撲克,首次戰勝人類冠軍。但同時,卡耐基梅隆大學的競爭敵手又暗示不平。
加拿大阿爾伯塔大學、捷克布拉格查理大學和捷克理工大學的研究者克日連系頒發論文稱,其所研發的人工智能系統已經在德州撲克角逐中到達了專家級程度。因此,他們的人工智能系統才是第一個戰勝人類的。
需要指出的是,該論文尚未顛末“同行評議”,因此今朝尚不行盡信。但基于這支團隊的汗青成績,他們聲稱的功效絕非空穴來風。
2008年,險些由同一批研究人員構成的一個團隊開拓了出了一套系統,首次在有投注限制的“有限注德州撲克”(Limit Texas Hold'em)角逐中戰勝人類好手。2015年,該團隊又完成了對該系統的進級,并稱已靠近完美。
阿爾伯塔大學研究人員在論文中稱,他們開拓的這套系統利用了一種名為“DeepStack”的通用算法,近期在“一對一無限注德州撲克”(Heads-up No-Limit Texas Hold'em)角逐中戰勝了人類。
2016年11月7日至12月12日,DeepStack共與33位人類選手在互聯網長舉辦了44852手較勁。角逐功效顯示,DeepStack的平均贏率為492mbb/g。DeepStack團隊稱,一般人類玩家到50mbb/g就被認為擁有較大優勢,而750mbb/g就是敵手每局都棄牌的贏率。
可是,輔佐卡耐基梅隆大學設計Libratus人工智能系統的托馬斯·桑德霍姆(Tuomas Sandholm)傳授稱:“DeepStack并未戰勝頂尖好手,因此還不能說它已經戰勝了人類。”
桑德霍姆還稱:“我們兩年前已經到達他們的程度了,日本游戲代理 歐洲服務器,但那不是我們的方針。我們的方針從來就不是‘專家級’,而是‘超人程度’,就像‘深藍’和‘沃森’那樣。”
到今朝為止,無論是在“有限注德州撲克”,照舊“無限注德州撲克”角逐中,人工智能系統只能應對“一對一”的角逐。而在多人(五人或更多)同時角逐中,其巨大性仍是人工智能今朝所難以應付的。但不管奈何,這些角逐功效表白,至少有兩套人工智能系統又要締造新的里程碑。
DeepStack研究人員稱,德州撲克是一種典范的非完整信息游戲,因為你不知道競爭敵手的牌,也不知道下一手牌是什么。因此,對付人工智能而言,其巨大性要高出象棋。而DeepStack是一種可用于一個很大類此外序列非完整信息博弈的通用算法,它所取得的后果表白,人工智能系統已經能干非完整信息游戲。
與谷歌的AlphaGo一樣,Libratus和DeepStack并不試圖辦理整個角逐的所有問題,因為這需要思量到太多的大概性。相反,這兩套人工智能系統操作深度進修來造就一種直覺。DeepStack研究人員稱:“在角逐之前,DeepStack不管帳算和存儲完整的計謀,而是利用一種快速的‘近似估算’法,我們稱之為‘直覺’。”
假如人工智能這一次能在德州撲克角逐中能戰勝人類好手,則意味著研究人員可以操作這套技能來辦理日常糊口中的一些實際問題,尤其是涉及到非完整信息的一些問題,如商務會談。在會談中,兩邊城市埋沒一些信息。
參加Libratus研發的卡耐基梅隆大學博士生諾姆·布朗(Noam Brown)稱:“在現實世界中,信息不行能像棋盤上的棋子那樣整潔有序,總有一些重要信息被丟失或埋沒,而人工智能需要有本領來處理懲罰這個問題。”