麻將本身復(fù)雜度低,人類頂尖牌手水平又不高,被人工智能擊敗會(huì)比圍棋要容易得多,不可能是“最后壁壘”。
現(xiàn)在有哪些比較強(qiáng)的麻將AI?
競(jìng)技麻將方面,目前國(guó)標(biāo)麻將和日本麻將都有比較強(qiáng)的AI(高于人類平均水平)。日本麻將的 AI目前最強(qiáng)的當(dāng)然是“爆打”。
“爆打”是由東京大學(xué)工學(xué)系在讀博士生水上直紀(jì)開發(fā)的日本麻將AI,他所在的課題組就是專門研究麻將AI的。
爆打和AlphaGo 一樣,也具有自我對(duì)局和分析并學(xué)習(xí)人類牌譜的能力。爆打從2015年開始在最大的日本麻將平臺(tái)——天鳳麻雀上開始運(yùn)行,至2016年2月已經(jīng)打了1.3萬(wàn)多場(chǎng)(約13萬(wàn)手牌)。
2015年9月,爆打達(dá)到天鳳麻雀四段,2015年12月更是一度沖進(jìn)天鳳七段,長(zhǎng)期成績(jī)顯示平均為六段以上。這意味著什么呢?
上圖是天鳳麻雀平臺(tái)2016年3月13日的段位成績(jī)分布圖(來(lái)源 対戦麻雀天鳳 /)。
天鳳平臺(tái)具有非常科學(xué)的段位和Elo Rating體系,越是和高水平牌手對(duì)局,獲勝后Rate增加越多,失敗后Rate減少越少;
越是和低水平牌手對(duì)局,獲勝后Rate增加越少,失敗后Rate減少越多。最終段位和Rate值的穩(wěn)定值就代表了牌手的真實(shí)實(shí)力。
可以看到,天鳳麻雀平臺(tái)的活躍用戶數(shù)約為17萬(wàn)人(不包括新人僵尸號(hào)),而六段以上的用戶總數(shù)為5793人,約占3.4%。
也就是說(shuō),爆打打麻將比96.6%的麻將玩家要好,全世界麻將打得比爆打好的人,數(shù)量?jī)H有幾萬(wàn)人左右(包含所有麻將規(guī)則的估算)。
這只是一個(gè)課題組,用時(shí)一年多研究出的,在一臺(tái)電腦上運(yùn)行的麻將AI,就已經(jīng)基本趕上 AlphaGo早期版本所取得的成績(jī)了。
國(guó)標(biāo)麻將方面,目前最強(qiáng)的AI大概是我本人目前正在參與設(shè)計(jì)的國(guó)標(biāo)麻將AI了。最初的版本只加入了最常用的十幾個(gè)番種的分值判斷,防守端幾乎沒有做,實(shí)測(cè)對(duì)隨機(jī)牌手和牌率就已經(jīng)達(dá)到24%左右,基本與國(guó)標(biāo)麻將平均和牌率24.3% 持平。
實(shí)際水平大概處在所有牌手中上位10~20%左右的水平(低段位牌手多,大部分牌手的水平處在平均以下)。
麻將 AI 的算法應(yīng)該是什么樣子的?
最后,我來(lái)淺談一下麻將AI的基本算法。