當前位置: 華文問答 > 數位

AlphaGoZero跟完美的圍棋之神有多大差距?

2020-02-18數位

問題有點多而且復雜,拿了張草稿紙寫了寫才算想明白了些…

先說說貼目吧,圍棋由於符合策梅洛定理中的規定條件,無論貼目是多少:

「要麽黑方有必勝之策略、要麽白方有必勝之策略、要麽雙方也有必不敗之策略」。

只要對圍棋和圍棋ai有些了解的人來說,很輕易可以發現在貼目為6.5時,黑棋優勢,貼目為7.5時,白棋優勢。而這點優勢如果交由圍棋之神掌控,那就是勝勢,即便對手也是圍棋之神。因為在正常情況下,只要貼目不為正數,就不會有平局出現

那這就存在一個問題:如果貼目為7時會怎麽樣?

剛開始我也被這個問題困擾了一會,後來突然轉念一想:在貼整數目的情況下,雙方最接近的情況也就是贏或輸對方1目。舉個例子:假如你執黑棋先行,需要貼給對方7目整,如果你能贏對手1目,那麽即使你在貼7.5的情況下也能贏0.5目;而如果你輸對手恰好一目,那麽即使你少貼0.5目你也照輸不誤。因此:

圍棋在某個整數貼目下雙方都是有「必不敗策略」的,而目前來看很可能是7目。但可能雙方中有一方必勝策略可能要多於對方,可能有一方只有很少甚至只有一種「必不敗策略」,不過對於參透了一切變化的圍棋之神來說,貼7目,無論執黑或執白就已立於不敗之地…

另外,由於圍棋雙方目數總和一定是361目,因此,在貼偶整數目的情況下,一定不會有平局出現(除非出現有眼雙活的特殊情況)

不過,這其中還有個非常重要的點需要指出:以上都是建立在常規規則之下的分析,即平局只發生在雙方終局之後目數完全相同的情況下。而圍棋還有「三劫迴圈」,「四劫迴圈」,「多劫迴圈」的局面,這種情況下是會判處無勝負(可以理解為平局)的,那會不會出現形勢不利的一方去努力形成復雜的無勝負局面來形成平局?暫時不得而知,這好像得看目前圍棋ai對無勝負局面的理解以及目前圍棋ai勝率中是否完全考慮了無勝負這種情況。。。

針對提問者補充問題說明2進行一些討論:首先,不是「圍棋某合法局面下最優解的數量」是什麽意思,感覺並沒有什麽很大的意義。其次,我說說我對於「有某一最優解的圍棋局面具備的特征」這一問題的看法:

除去一些顯而易見的,一眼就能看出最優解的局面(比如兩條貫穿全盤的大龍對殺,僅一氣之差),其他的貌似走哪都行,你去問不同的職業棋手,會得到與之棋風大致相匹配的答案,去問ai勝率也只浮動1個百分點以內的局面,以目前人類的技術水平來說,很難找到真正的最優解。即使你拿著頂級ai讓他就對著這一張圖使勁訓練,得到了精確到小說點後幾十位的勝率,發現其中某個點應該更好。那最多也只是目前人類的技術水平下的最佳,是否能得到ai的認可尤未可知。因此目前來看是否有最佳解的局面之間還有很大的一段未知地帶,也不用說是否能有人給出有唯一最優解圍棋局面的特征了。。。

針對補充問題說明3:圍棋之神是必然不可能有認輸功能的,也完全不需要一個函式或者模組去判斷是否需要認輸。因為它參透了圍棋的所有變化,也只知道圍棋的所有變化。這麽說的原因是圍棋之神的勝率只有100%(必勝)與0%(必不勝即輸或平)兩種,而這種勝率是建立在對方也是圍棋之神的情況下才有意義的,且如果真的對手是另一個圍棋之神,那必敗的一方開局認輸,貼7目整的棋局雙方隨便走一走一平局收尾也是合情合理。但如果他的對手是你我凡夫俗子,抑或是絕藝、AlphaGo這種頂級ai(其實在圍棋之神眼裏並沒有什麽區別),那它就不能再在開局自認為必敗時認輸,因為它的對手實力遠遜於它,這樣做很不合理。

因此我們的圍棋之神需要選擇一種最佳下法繼續棋局。在此指出題主一處錯誤,此時圍棋之神不應該是采用「雙方理想情況下,子差最小」的下法,而應該采用像另一位答主 @forest 所說的「盡量將局面導向混沌,即最復雜的下法」,不過如何定義「最復雜的下法」還有待考究,但一定不等同於題主所說子差最小。原因就在於圍棋只有勝或負兩種情況(不考慮平),輸半目與全盤沒有活棋並沒有區別(當然面子上過不去),比賽的獎金不會因為你只輸了半目而多分你一點,所以在劣勢局面下,釋放勝負手是唯一的選擇(總好過安樂死)。所以圍棋之神也需要在開局自認為必敗的情況下釋放它自認為的「勝負手」,盡可能讓局面變得復雜。

再回答題主比較關心的一點:圍棋之神究竟能讓AlphaGo幾個子?

由於圍棋之神現在並不存在,AlphaGo也已退休,所以拿其他對局來進行參考:

最近一次人類與ai的正式對局應該是去年年底李世石的退休三番棋,與南韓本土ai韓豆的受2子、分先的對局。

李世石引退賽第一局

三番棋中最大的亮點應該就是第一局李世石的黑76天外飛仙

神之一飛

這一步不僅當場擊潰韓豆,就連絕藝、星陣等其他頂級ai也都沒有看到。

圖1

圖1:韓豆當時應該只看到了黑1大吃的手段,所以提前用白 與黑棋做了交換。

圖2

圖2:白棋如果打完想要壓出,黑4可以與白5交換,然後吃掉中腹棋筋。

圖3

圖3:如果白棋打完粘上,黑4與白5交換後,有黑10位妙手,恰好能夠將白棋棋筋吃住,白不行。

圖4

圖4:白1最強應對,不過雖然給我吃不住中央棋筋,但可以將下方大塊白棋抱住,殺氣白棋顯然不行。

考慮到韓豆此次比賽前已經進行過4個多月的讓子棋訓練,應該屬於所有ai中讓子棋最強的,且李世石即便是即將隱退但實力仍然是一流的,所以這盤棋以及這一手飛還是相當有說服力的,也就是說ai並不像我們想象中那麽那麽那麽強,也會有漏算的時候。面對人類棋手尚且如此,更遑論圍棋之神呢…

因此我偏向於圍棋之神大概能讓AlphaGo3子不分勝負或者稍弱一點點,讓4子偶爾能抓住AlphaGo的失誤取勝

歡迎加入知乎圍棋交流圈: