當前位置: 華文問答 > 數位

柯潔與 AlphaGo 對戰勝算有多少?

2017-05-23數位

這是個老問題。現在比賽真的開始了,我也簡單說說我的想法。

原文:人機大戰,個人期待+偽預測 - 知乎專欄

(原文的釋出時間是開賽前,不是馬後炮啊233)

首先,我簡單評論一下【新浪】人機大戰柯潔專訪-柯潔:曾經準備秘密武器 面對阿法狗奮戰到死 這篇新浪對柯潔的專訪。這篇文章裏柯潔的回答都非常好,和之前接受采訪時忽高忽低的說話水平相比,進步很大。其中提到了模仿棋的事,柯潔是這樣說的:

問:當時因為住院最後一戰沒上場,還發微博說準備了秘密武器? 柯潔:當時準備對付AlphaGo的是模仿棋,因為沒人用過。不過*古哥*肯定測試過,所以我認為模仿棋恐怕也沒什麽用,真正下的時候我也不一定會用,但網上可以試試。不過黑棋下模仿棋不太合適,天元一子發揮不了作用,屬於白白浪費機會。

之前我寫過一篇模仿棋的分析模仿棋,對戰AlphaGo的最後一招 - 知乎專欄。柯潔證實了之前準備對Master使用的「秘密武器」就是模仿棋。所謂「*古哥*肯定測試過」,也確有其事。就在上個月,紀錄片【AlphaGo】首映式,我在現場詢問DeepMind執行長哈薩比斯,AlphaGo能否對付模仿棋。哈薩比斯的回答是「It should be okay, but we will see.」 我的解讀是,AlphaGo團隊針對模仿棋曾做過針對性的測試,且沒有出紕漏;不過,在沒有上戰場之前,哈薩比斯也不敢打包票。

即使如此,我還是期待柯潔能夠下一盤(執白棋的)模仿棋。和AlphaGo下模仿棋,柯潔可以慢悠悠搖著紙扇,喝著龍井茶,笑看對手出招;否則,以對手的強大,柯潔難免要咬手指、揪頭發。畢竟全國人民都看著呢,形象很重要。



(配圖來自新浪)

在之前模仿棋那篇文的評論區,有些人把模仿棋理解成耍賴。要知道,職業棋手在正式比賽中罕用模仿棋的原因,不是因為它不道德,而是因為模仿棋在技術上風險較大,容易被對手牽著鼻子走。然而,除非AlphaGo已經成精,她不會對模仿棋有什麽針對性的策略,也就談不上牽著柯潔鼻子走。相對地,模仿者的優勢,在人機大戰中被成倍放大:一是節約時間;二是能將局面拖入亂戰或者後半盤收束,也就是AlphaGo相對不那麽強的領域。小結一下,從勝負角度看,模仿棋是柯潔最好的策略之一;從測試AlphaGo的目的看,模仿棋能夠檢驗AlphaGo是否已經成精,強大到無死角的地步。

除了模仿棋,柯潔可能還有其他秘密武器。我猜測「三三」是其中之一。「三三」開局,和布局階段的直接「點三三」,在過去二十年裏,極少出現在職業棋譜上。自吳清源、木谷實掀起「新布局革命」以來,星、小目、三三、目外的占角曾齊頭並進數十年。近期的棋譜裏,只見星、小目,不見目外、三三。在布局階段的「點三三」,也被認為是送對手外勢的損棋。然而,化名Master的AlphaGo變身「點三三」狂魔;不僅掏空對手的角地,還追著對手的外勢攻擊,極其兇殘。



(右下角帶圈一子,就是Master 「點三三」。「三三」是從棋盤兩邊數起各三條線的點。在對方先占「星位(四四)」的情況下,在「三三」落子,就是「點三三」,即右下角的棋型。)

Master之後,柯潔也開始大量使用點三三這一招。前不久的新奧杯準決賽,柯潔就下了點三三,擊敗李喆。不過,柯潔也曾在用到點三三的棋局裏嘗到敗績。除了點三三之外,柯潔還嘗試了三三占角開局。這個嘗試也很好理解:既然點三三是好棋,那麽我就讓你沒有三三可以點。既然我占星位你點三三不吃虧,那麽我先占三三,被你星位肩沖,我的內心毫無波動,甚至還可以脫先。此前與AlphaGo的對局中,人類很少用三三開局。說不定,三三開局就是柯潔的又一個秘密武器。

最後是個人向偽預測。

1. 比分(柯潔在前,AlphaGo在後)。

3:0或2:1,機率<1%; 1:2,機率 10-15%; 0:3,機率 85%-90%.

柯潔贏一盤就是偉大的勝利,足以載入史冊。全敗是正常結局。總比分獲勝。。也許AlphaGo的機箱裏真的藏著另一個柯潔呢?

2. 柯潔使用秘密武器的機率:

模仿棋: 40%; 三三開局:30% (已經在第一局使用); 布局階段點三三: 60% (已經在第一局使用) ; 妖刀、雪崩定式飛刀: 15%.

3. 團戰(五人組)勝率:2%。時間太短,至少要五小時基本用時才能發揮相談棋的優勢。五人組的配合可能也不如金龍城杯的三人組合。( 結果:中盤負

4. 聯棋:預測 古力+AlphaGo 中盤勝 連笑+AlphaGo。(結果, 連笑中盤勝