新浪科技 2017-01-12 14:06:53
北京時(shí)間1月12日消息,加拿大與捷克研究人員開發(fā)了撲克機(jī)器人,它已經(jīng)在一對(duì)一比賽和無限下注德州撲克比賽中打敗了人類職業(yè)玩家,撲克機(jī)器人的勝利標(biāo)志著AI取得了新的突破。本周晚些時(shí)候,匹茲堡賭場(chǎng)將會(huì)舉辦撲克錦標(biāo)賽,到時(shí)幾名世界級(jí)撲克玩家將會(huì)與卡內(nèi)基梅隆大學(xué)開發(fā)的程序?qū)Q。
北京時(shí)間1月12日消息,加拿大與捷克研究人員開發(fā)了撲克機(jī)器人,它已經(jīng)在一對(duì)一比賽和無限下注德州撲克比賽中打敗了人類職業(yè)玩家,撲克機(jī)器人的勝利標(biāo)志著AI取得了新的突破。
研究人員稱,程序用“逼近法”打敗了人類對(duì)手。密歇根大學(xué)游戲理論與AI教授邁克爾·韋爾曼(Michael Wellman)認(rèn)為:“如果真是這樣,意味著游戲AI取得了明顯進(jìn)步。首先,它是一個(gè)里程碑,AI在游戲中打敗了撲克職業(yè)玩家。其次,它將一些新創(chuàng)意結(jié)合在一起,開創(chuàng)了激動(dòng)人心的新方法,我們可以用這種方法應(yīng)付信息不完全的游戲。”
本周晚些時(shí)候,匹茲堡賭場(chǎng)將會(huì)舉辦撲克錦標(biāo)賽,到時(shí)幾名世界級(jí)撲克玩家將會(huì)與卡內(nèi)基梅隆大學(xué)開發(fā)的程序?qū)Q。卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)教授圖奧馬斯·桑德赫爾(Tuomas Sandholm)是程序的主要開發(fā)者,他說參賽的選手比之前測(cè)試時(shí)的選手強(qiáng)很多,在20多天的比賽中,玩家將會(huì)打出12萬手撲克,研究人員可以統(tǒng)計(jì)數(shù)據(jù),為開發(fā)工作提供幫助。一直以來,人們認(rèn)為撲克對(duì)于電腦來說過于復(fù)雜,錦標(biāo)賽也許可以向我們證明AI已經(jīng)可以在撲克上超越人類了。
撲克軟件DeepStack曾經(jīng)打敗過職業(yè)玩家,它是加拿大阿爾伯塔大學(xué)計(jì)算機(jī)教授邁克爾·保林(Michael Bowling)領(lǐng)導(dǎo)開發(fā)的,查爾斯特大學(xué)和捷克理工大學(xué)的研究人員也參與了研發(fā)。網(wǎng)上刊發(fā)了一份研究報(bào)告,研究人員在報(bào)告中表示,DeepStack與幾名人類玩家比賽,打了4.5萬手撲克,輕松獲勝。
人類也曾與AI在其它游戲中對(duì)決,相比而言撲克更加復(fù)雜。撲克不確定因素很多,比如對(duì)手可能會(huì)欺騙,在現(xiàn)實(shí)世界中到處都是欺騙,AI還不懂得怎樣欺騙。撲克玩家看不到對(duì)手的牌,但在西洋棋、國(guó)際象棋和圍棋中,大家可以看清對(duì)方的棋子。今年年初時(shí),Alphabet子公司DeepMind開發(fā)的AI程序打敗了李世石,他是韓國(guó)知名職業(yè)圍棋高手。
對(duì)于機(jī)器來說,不限注德州撲克太難了,每一手牌都有10的160次方種(10的后面跟160個(gè)0)可能。DeepStack通過自己與自己打撲克不斷學(xué)習(xí)。每打完一局,系統(tǒng)就會(huì)修改優(yōu)化策略,讓技能更上層樓。由于不限注撲克很復(fù)雜,系統(tǒng)通過玩限注撲克來提高技巧。為了處理復(fù)雜性問題,研究人員使用了快速逼近技術(shù),他們將之前的撲克比賽資料輸入深度學(xué)習(xí)算法,不斷優(yōu)化精煉。
密歇根大學(xué)韋爾曼認(rèn)為,撲克是一種復(fù)雜的游戲,采用新技術(shù)之后,系統(tǒng)碰到各種情況都可以有效應(yīng)對(duì),這是新的突破;以前要繪制整個(gè)樹,將各種可能性找出來。
研究人員將DeepStack的逼近技術(shù)與人類玩家的直覺類比,當(dāng)對(duì)手欺騙或者拿到一手可以獲勝的牌時(shí),人類會(huì)用直覺判斷,比如根據(jù)對(duì)手的語言來判斷,機(jī)器不同,它根據(jù)對(duì)手的下注模式來判斷。研究人員稱:“我們可以將這種估計(jì)看成是DeepStack的直覺。”
通過觀察撲克玩家在多次對(duì)決中贏得的金額,系統(tǒng)可以評(píng)估玩家的表現(xiàn),而不是根據(jù)桌面上的下注額判斷。與優(yōu)秀的職業(yè)選手相比,DeepStack的勝率高了大約9倍。
2015年,保林與阿爾伯塔大學(xué)的同事找到了解決方案,他們開發(fā)的撲克機(jī)器可以玩限注德州撲克,表現(xiàn)很完美。參加匹茲堡錦標(biāo)賽的機(jī)器人名叫“Libratus”,它是圖奧馬斯·桑德赫爾(Tuomas Sandholm)與學(xué)生諾姆·布朗(Noam Brown)合作開發(fā)的,Libratus用匹茲堡超級(jí)計(jì)算中心的強(qiáng)大硬件運(yùn)行。
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP