人工智慧剛打敗了世界上最頂尖的撲克牌玩家們,嚇唬能力超強!

Comment is Closed

必須要知道什麼時候蓋牌。

4名世界頂尖職業撲克牌遊戲玩家在一場盛大的20天競賽中被徹底打敗,因為一套人工智慧(artificial intelligence,AI)系統在掌控無限下注的德州撲克(no-limit Texas Hold’em)12萬副牌之後,贏得巨大勝利。

這套人工智慧,稱為Libratus,在比賽結束時贏了人類玩家將近180萬美元的籌碼。對僅僅兩年前來說,這是一個鮮明的對比,當時一套不同的程式只是在設法與4名人類職業玩家達到技術上的平手。在2017年的複賽,人類甚至連一點機會都沒有。

由卡內基美隆大學(Carnegie Mellon University,CMU)的電腦科學家所開發的Libratus,緊跟在之前比賽勝過人類的人工智慧之後,像是谷歌(Google)的DeepMind,擁有一些世界上最傑出的圍棋冠軍

但是學習撲克牌遊戲是更微妙的,就心理領域而言,是能夠精通嚇唬對手的藝術,同時還察覺他們的暗示,顯示驚人複雜的人工智慧正在挑戰成功依靠的不僅僅是精通牌桌上的規則。

卡內基美隆大學的電腦科學主管法蘭克‧普芬寧(Frank Pfenning)說:「如果電腦無法做到嚇唬,電腦就不能在撲克牌遊戲獲勝。」

「發展一套能夠做到嚇唬的人工智慧,在科學上是向前邁進的一大步,而且有許多的應用。想像一下,你的智慧型手機有一天能為你的新車洽談到最好的價格;這只不過是剛開始而已。」

推薦文章:  再四年我們就能翻譯海豚的語言!

Libratus的撲克牌戰略是在比賽開始之前,磨練相當於1,500萬小時的比賽玩法。人工智慧被安裝在每秒執行1.35拍浮點運算( petaflop,1 peta = 1×1015)和274兆位元組(terabyte,1 tera = 1×1012)記憶體的超級電腦上。

這些規格意味著超級電腦的執行速度大約是高階筆記型電腦的7,250倍,記憶體大約是17,500倍。

但是,人工智慧的殺手特色是向人類職業玩家學習,作為競爭的提升,並且當其他參賽者取得優勢時,適應性地修補自己的戰略和比賽風格。

首席研究員托馬斯‧桑德霍姆(Tuomas Sandholm)說:「每天比賽結束後,一個整合演算法(meta-algorithm)會分析這些職業玩家在Libratus的戰略中所發現到和利用的漏洞。」

「然後,每天晚上利用超級電腦排出漏洞的優先順序,並且在演算法上修補排名前3的漏洞。通常,研究人員發展演算法是要嘗試利用對手的弱點。對照之下,每天在這裡的改善是有關於在演算法上修補我們自己戰略中的漏洞。」

這種方法是成功的,即使它在人類對手之間造成一些絕望。他們不得不在20天的馬拉松式比賽期間,不斷地調整自己的戰術。

比賽中途,職業玩家之一的Jimmy Chou說:「這個機器人每天都在進步,它就像是我們更強大的版本。」

推薦文章:  死過兩次的男人說大家不用擔心有沒有上帝了

Chou的競爭夥伴之一Dong Kim附和這些觀點。

在比賽的第10天,他告訴連線雜誌(Wired)的卡德‧梅茨(Cade Metz):「我沒有注意到它有多好,直到今天。」

「我覺得像是在跟一名正在作弊的人比賽,好像它可以看到我的牌,但我不會指控它作弊,它就是那麼好。」

您可以在下面的圖表中看到Libratus的適應性如何有效率:

雖然人工智慧在比賽的前5天取得初步領先,但在第6天,所有參賽者的籌碼大致相同。

但之後Libratus脫穎而出,在接下來9天籌碼大幅增加大約1百萬美元,而人類玩家一直處於不利地位而無法扳回局勢。

現在,比賽結束了,卡內基美隆大學的研究人員表示將分享這項人工智慧的秘密,從本月人工智慧進展協會(Association for the Advancement of Artificial Intelligence)在舊金山舉行的會議的簡報開始。

推薦文章:  德國科學家發現光能使癌細胞粉碎!

預計學術論文討論程式設計將在未來的幾個月。

除了高風險的紙牌遊戲世界,研究小組表示,Libratus的決策能力可能最終在商業談判、網絡安全、甚至醫學治療中發揮作用。

至於參賽者,儘管挫敗,還不值得為這些職業玩家感覺太糟,因為他們每個人都會在這場比賽分享20萬美元的共同獎金。

也就是說,他們或許不會想再和人工智慧玩20天的直接撲克(straight poker)。在比賽的最後一天,職業玩家之一的丹尼爾‧麥考利(Daniel McAulay)轉向一名觀眾,提出一個可能是半開玩笑的問題。

他問:「我要付你多少錢來玩最後50副牌?呃,這太殘酷了。」

來源:ScienceAlert