當前位置: 華文問答 > 數位

AlphaGo 有沒有「棋風」?它在下棋時會犯錯嗎?

2017-05-25數位

AlphaGo 沒有自己的棋風

因為mcts演算法的緣故,招法具有一定的隨機性,同分值的招數可能同時存在好幾個。用時、規則不同等等下法也會變化。

AlphaGo 會犯錯,但是犯的錯目前看,由於大局方面實在太強大,在和頂尖高手對局中基本不影響勝負結果。

援引live 中我和 @範廷鈺 九段討論的結果,AlphaGo確實強大,但是確實有很多局部上的問題手,這一點不必神話。

AlphaGo犯錯的方式有幾種:

1,沒有必要現在下的棋,立刻走。圍棋界稱為「俗手」,因為提早走會讓自己以後的余地大大減少。

2,舍大取小,這一點在優勢的收官階段非常常見,一旦進入劣勢就會瘋狂體現(go 李第四局)。

之後的內容我會分門別類詳細概括一下:

「棋風」是 「行棋風格」 的簡稱。

棋風是每個棋手由內而外呈現的招法整體。

可以說,過去的時代,大家非常喜歡給頂級棋手加一些棋風的描述,增加辨識度。

在二戰之後,可以說當時每個頂尖棋手,都被描寫的特點十足。

剃刀」的阪田 ,非常銳利,局部作戰計算精準見長,常有兇險招數直取要害。

之後阪田九段在對陣當時年輕的林海峰的時候,說「不可能有二十歲的名人」,之後被林海峰奪走了頭銜。

「二枚腰」的林海峰 ,「二枚腰」一詞來自於相撲,說的是腰身寬大不易被摔倒,仿佛有兩個腰一般。林海峰九段棋風 厚實均衡,韌性極強 ,喜歡把對手的意圖接受過來,最後一刻發力。



我們從強關聯的詞開始講: 流派、風格、特色 都是藝術中常見的歸類方式。

『特色』 強調顯著不同的點。

「先生,您好,虎皮青椒炒肉絲拌薯片是我們的特色菜。」

『流派』 則往往是風格較統一、體系化的。


(簽名別具一格,宇宙流三個字非常寫意)

「武宮正樹九段的宇宙流可以說是非常具有視覺沖擊力的,奔放自在,非常宏大。」

個人風格常常會隨著閱歷、訓練等等因素發生變化,流派則常常被大家代指是一種會吸收轉化其他風格、特色為己用,保持一致內在精神、外在形象的進階產物。


說『風格』

風格是整體性呈現,由內而外,有代表性的面貌。對於每個棋手來說,風格是受自己的思維習慣,訓練歷程,內在品質深深影響的。

裝修有:「極簡主義」風格、「歐式復古」風格、「狂拽酷炫殺馬特」風格……

(說了殺馬特風格後面就突然不想再舉例了,感覺忘了愛)

意氣駿爽,則文風清焉 」 【文心雕龍】

有人最近傳言 說鄰居李大頭有不好的「脫鞋風格」。

「老李你怎麽能每次 左腳右腳互相連蹬,每次回家非要先踹走自己的鞋呢?你這個人脫鞋的風格太奇怪了。」

這認真看就是不對的,這個脫鞋風格沒有一點內在流露,也沒有一個整體的外貌呈現。

除非說你是順便練那個「梯雲縱」的輕功?

所以這種懶出來的「風格」只能自封。

-------------------------------------------------------------------------------------------------

「棋風」 對於每個棋手來說,是一種『 路徑依賴 』。

對於藝術性較強的領域,比如文學、繪畫。

1,比如王二寫小說,寫到

「今天王二在街上遛彎,突然對大街上的駱駝們有了XXX 一般的情愫。」

這裏用什麽詞見仁見智。

所以文學家們都會琢磨一套自己的風格,駕馭熟練了,寫起來非常自如。

2,比如張大鬥畫畫,琢磨著頭皮和腳趾頭應該是什麽顏色。

這裏用什麽顏色,什麽筆觸,沒有一定之規,也是畫家自己決定。

——————————————————————————————

圍棋隨著計算、推理的深入,每一步的好壞可以越來越清楚地判斷出來,圍棋的不確定性不同於藝術領域,是有好壞標準的。

圍棋的判斷標準,在近幾十年完善的非常快,可信度也越來越高。

源頭 上我們可以說這樣的路徑依賴來自於過去的訓練,習慣了這樣去思考,習慣了先朝這裏走一手,習慣了用這樣的連貫招式去定型。

我們每個人提高的過程首先是學習前人經驗的過程,拿前人最好的知識精華來「投餵」自己,透過死活等手段訓練 肌肉記憶 ,就像功夫熊貓裏面每一個master那樣。

———————————————————————————————

關於棋風背後的模式化

10年的 ted有一篇非常經典的演講,關於思考模式,關於「 The pattern behind self-deception 」

文章裏對人的 思維傾向常見的問題做了一個二分法:

I call this process "patternicity" — that is, the tendency to find meaningful patterns in both meaningful and meaningless noise. When we do this process, we make two types of errors. A Type I error , or false positive , is believing a pattern is real when it's not. Our second type of error is a false negative . A Type II error is not believing a pattern is real when it is. So let's do a thought experiment. You are a hominid three million years ago walking on the plains of Africa. Your name is Lucy, okay? And you hear a rustle in the grass. Is it a dangerous predator, or is it just the wind? Your next decision could be the most important one of your life. Well, if you think that the rustle in the grass is a dangerous predator and it turns out it's just the wind, you've made an error in cognition, made a Type I error, false positive. But no harm. You just move away. You're more cautious. You're more vigilant. On the other hand, if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.

第一類是 false positive , 事物之間沒有聯系的時候傾向於認為有聯系,「寧可信其有不可信其無」。(也是迷信的主要原因)

比如王不二有一天說了這麽一句:「那天我摔了一跤,然後耳邊響起了風聲,那一定是周圍空氣裏的小惡魔們嘲笑我飛來飛去~ 」


第二類是 false negative, 有關聯的情況下更願意相信「其實沒有聯系」。

比如李大頭有這麽一句:「愛亂扔東西和我自律不自律一點關系都沒有,這是我的本能」


原文裏面的例子 非常踏實,有一天你在叢林裏走,聽到一陣異響,你是傾向於相信有危險做防備撤離開還是大大咧咧繼續走下去?

總之,萬一 確實是危險的捕食者,你就完了。

所以人們常常願意說「寧可信其有不可信其無」,來自於古老的生存本能,我們可以常見各種「危機論者」,有備無患準備很多東西,但是大家還願意效仿。因為那些 什麽都不願意提早做準備,相信什麽都不會發生的往往會早早被突發事件幹掉。

if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.

Darwin Award, 被移出前進演化的鏈條裏,嘖嘖。

————————————————————————————————————

幾年來我和很多棋手聊過棋風的問題,發現很多高手並不認可自己被媒體總結的棋風,還是更願意以因地制宜來形容自己。

藝術性的方向的發展會越來越展示自我,勝負向的則會非常明顯的調和一個人的各個方面。

現代頂尖棋手,棋風更加多變,以研究清晰的變化為先,計算清楚的招法為準,發揮個人風格越來越淡。

當時邀請 @範廷鈺 九段的時候,我說一句話形容自己,你會怎麽說,範九段寫了四個子在自己的個人介紹裏:

人生如棋

感慨頗深。

————————————————————————————————————

AlphaGo 有很多錯誤,但是目前只有李世石與AlphaGo的第四盤因此影響了勝負

前面說AlphaGo兩種常見錯誤方式:


【1.俗手】


白棋66扳出,是標註的俗手,這一扳可以確定隨時都能和67外扳交換。現在沒有必要下,會減少自己的余地,這樣的棋AlphaGo較多出現。


【2.判斷失誤】


這裏白棋154的扳是明顯的失誤,黑棋155本身就很有價值,後手挖吃兩子,之後差距縮小。


【低階失誤】

AlphaGo收官也有一些非常低階的失誤,明顯是演算法在處理復雜的收官還是有一些問題。


這是取材自之前化名 master{P} 大殺四方時期對陣若水雲寒(P)的對局,白棋下邊被打吃的時候白棋不接上選擇了246 打吃,被提掉之後由於之前在拼命地賣劫財,導致虧損。


AlphaGo 基於具有一定隨機性的演算法做出決定,沒有棋風。

AlphaGo仍然有很多明顯的錯誤,大局觀取勝,確實有銳劍無鋒一般的感覺。

歡迎大家繼續支持我和 @範廷鈺 九段全程對局解析:

和職業九段一起看懂柯潔對戰AlphaGo

(這次參與的聽眾素質都非常高,範九段也非常有積極性與大家一起探討,回答疑問。)