當前位置: 華文問答 > 數位

柯潔和 AlphaGo 的第二盤棋值得關註之處有哪些?

2017-05-25數位

今天柯潔的發揮可以說非常出色,完成了另一種風格的測試。前天我說柯潔雖然看上去最後只輸了1/4個子,但全場落後一步找不到拼的機會,AlphaGo發揮出色到可以說為,穩健到讓柯潔想玉碎都找不到玉碎的機會。但今天,柯潔找到機會了,雖然最後真的玉碎了(輸了一枚劫財)。

第一盤柯潔開局就模仿了AlphaGo喜歡下的下法,然後卻導致稍稍落後,再也追不上。今天AlphaGo卻反過來模仿了柯潔最近喜歡下的開局,實在是非常有意思。

黑1、3小目配三三的開局,最早流行是在上世紀六十年代末到七十年代初,當時最喜歡下這種布局的代表性棋手是日本的超一流棋手「剃刀」阪田榮男九段和「電子電腦」石田芳夫九段。但當時還是黑貼5.5目的小貼目時代,現在卻施行大貼目規則(中國規則黑貼3.75子,日韓規則黑貼6.5目),因為有這兩目之差,所以哪怕同一種開局所導致的局勢其實也不盡相同。

今年,柯潔開始大量使用這種布局,前天的第一場比賽也用了,而AlphaGo今天也選用了這種開局,是一種極為有趣的現象,好像程式變的多元化了一樣。Master元旦出場期間,選用的開局大多簡單,來來回回就是少數幾種最流行的開局,然後用簡明的定式變化和下法進行定型,大局上稍微一控制就明顯領先,然後就收兵贏了。這樣子讓人看不到上限,只覺得很強,但也稍嫌乏味。今天程式用出新布局,很好玩。

下到上圖這個情況,黑5、白6各自強掛小目防止守角,是很標準的傳統布局大場順序,黑7、白8又都選用側小飛這種相對松緩的定式,給人感覺像是日本巔峰時代的常見對局:開局不急不忙,後發制人,流水不爭先。到此時,感覺雙方都在復古......但是僅僅幾個回合後,雙方立刻圖窮匕見......

右上角AlphaGo選用了自己喜歡下的托角而非常見的小飛,然後雙方在局部各種蜻蜓點水的試探,鬥智鬥勇,哈撒比斯說柯潔局部的下法和AlphaGo判斷的一樣,頂尖職業中有些人認為這個局部雙方的下法屬於很有價值的新變化。AlphaGo黑29之後柯潔脫先,然後雙方開始在棋盤左下方廣闊地帶拼命飆車......大規模亂戰已成。至此,柯潔的想法應該已經展示的很明顯,想測試一下大規模亂戰下會怎麽樣。

後續的變化非常非常的復雜,大家可以看各種頂尖職業的研究後解說。可以說柯潔前半盤的狀態非常良好,棋局一度非常混亂,雙方形成天下大劫,而柯潔沒有立刻引爆,而是多次在各種局部保留,試圖大量增加程式的計算量負擔。最終柯潔認為做好了準備,引爆了天下劫之後,很多人認為白棋有機會,但是在復雜的劫爭過程中第一個出現失誤的是柯潔,劫財轉換後白棋簡單的不行了。

私下有一些朋友問我對比賽的看法時,我都說這次比賽其實像是以比賽的形式進行測試,在有時限有儀式感的正式比賽中,更容易激發運動員突破極限。第一盤棋柯潔想用AlphaGo的常用下法測試,然後下成了第三代電腦圍棋程式最擅長的鋪地板的陣地戰;第二盤柯潔想用亂戰的方式,尋找程式在極復雜變化中的bug,理論上這可能是正面找到勝機的唯一機會,因為蒙地卡羅演算法的強邏輯缺失是最容易想到的電腦圍棋的缺陷,去年李世石贏下一盤,也是找的這種毛病。

AlphaGo今天在亂戰中笑到了最後,但並不說明柯潔的策略是錯的。不管是以測試為目的,還是以贏下比賽為目的,既然知道AlphaGo如果有弱點,最可能出現在這種局面下,那就應該導向這種局面。那句話怎麽說來著?唯一的辦法,就是最好的辦法。今天,柯潔也確實將局面導向了自己想要的方向。如果平穩的鋪地板鬥功力,或者大模樣鬥大局觀,在深度神經網路形成的如此良好的棋感+大局觀之下,基本都是安樂死。畢竟那種情況電腦不犯錯,對於弱邏輯的虛路棋,大量棋局統計出來的結果總是比你一個人能形成的棋感更穩定準確。

總的來說,這是一盤精彩的對局,柯潔發揮很出色,AlphaGo一如既往的穩定和強大,但前半盤不見得下的完美。期待賽後Deepmind公布更多後台數據,讓我們看到AlphaGo的判斷和選擇,相信會給我們更多的啟迪。

明後天的比賽,還是前天那句話,期待看到各種姿勢的測試。

祝柯潔以及其他棋手們發揮上佳。