當前位置: 華文問答 > 數碼

面對人工智能碾壓性的計算能力,人類是否還有深入研究圍棋等對弈遊戲的必要?

2016-03-13數碼

-

渴求真理的好奇心,是人類前進的永恒驅動力。

而宇宙的廣袤及世界的龐大,又是人的想象力和行動力所難以企及的。

還記得那個流傳了數千年的故事嗎?

印度的某位國王要獎賞國際象棋的發明者,發明者提要求說:「在國際象棋棋盤的第一格裏放一顆麥子,第二格裏放兩顆麥子,第三格裏放四顆麥子......依此類推,每下一格的麥子數是上一格的兩倍,放滿全部64個格子,將這麽多麥子獎賞給我就行了。」

然而國王卻發現這是一個他想象不出有多大的數碼,即使將全國的麥子都拿來也擺不滿哪怕半個棋盤。

我們大家應該都是在小學時就知道這個故事了,也知道這個數碼其實是個天文數碼。

實際上,這個數碼大小為:

1+2+2^2+2^3+...+2^63

=18446744073709551615

這是一個普通的科學小算盤都無法完全顯示的數碼。

而國際象棋的全部合法局面數(可能對局數還要更多一些數量級),量級為:

10^46

=10000000000000000000000000000000000000000000000

面對這個比剛才那個數碼更長的數碼,請大家體會一下這個全世界最流行的棋種的博大。

但上面那個數碼並不是大家可以借助實物去想象的最大數碼。

在現在的天文學研究中,根據一定的理論模型,已經可以大致估計出宇宙中的總物質素。

上世紀初,曾經的英國劍橋大學天文台台長、世界級著名天文學家亞瑟·艾丁頓,估算出了宇宙中質子總數的量級,這個數碼為:

136*2^256

=15747724136275002577605653961181555468044717914527116709366231425076185631031296

這個數碼也被稱為「艾丁頓數」。

雖然這個精確數碼只是估算值的展開,與現實情況可能不相等,但量級應該大致是一樣的。

想象一下,在我們的宇宙中,一共有著這麽多的質子,這麽多的物質。

這就是我們的整個宇宙。

本來就聞名世界,最近更是賺足了全世界人類眼球的美國谷歌公司,其英文名google其實是從googol演化而來的,而後者其實是一個數碼:

googol

=10^100

=1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

這是一個比上面的宇宙全部質子數更大的數碼,我從這個數碼中,體會到了谷歌創始人們對未知世界的好奇心,以及探究未知世界的野心。

而就在距今不久之前,荷蘭國立數學和計算科學研究所的科學家John Tromp,計算出了一個數碼:

208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935

≈2.08*10^170

上面那個數碼,就是圍棋在19路棋盤的條件下,全部合法局面數的精確值。(實際可能對局數還要遠高於這個數量級)

大家感覺如何?

我擺出這幾個數碼不是為了嚇唬誰,或者顯示我的數學很好,而是因為如果我在沒有對比的情況下直接擺出最後這個數碼,大家很難憑借人類自身的想象力,體會它的巨大。

在數學形式上有窮,而在實際操作中等效於無窮,這就是圍棋的變化空間。

說到底,按照上面提過的相關數碼,宇宙也不過是有窮的,而我們人類發明「無窮」這個詞,也不過是為了在我們自身想象力、計算力和行動力都有限的情況下,表達和體會那種我們自身無法企及的幾乎「無限」的巨大。

大家覺得,哪怕耗盡人類在宇宙中存在的全部時長,憑借我們現在還無法想象的未來科技進步,有可能窮盡這個數碼所代表的19*19路棋局數嗎?

我不知道。

提起圍棋,容易立刻想到的除了它龐大的變化空間之外,就數其簡單而樸素的規則了。

圍棋的規則大致可以簡單歸納為以下三條:

1. 黑先白後交替落子於交叉點上,最終占點多者為勝,且黑貼白目以平衡先手優勢。

2. 與子相鄰的空點為其氣,氣盡則亡,無氣點禁入。

3. 禁止全盤同型,即在一局棋中,棋盤上不可出現之前出現過的棋型,以避免棋局陷入迴圈。

圍棋就是建立在如上的簡單規則上的世界,從這幾條規則開始演化出眼、兩真眼成活、簡單對殺規則等一系列可以用數學語言精確表達出的規律。

以獲取全盤勝利為最終目的,在這些第一層的規律之上,又有著更多的規律,這些規律形成和解釋了從空白的開局開始直指最終勝利的最優解。

而且,不只是從空棋盤開始,對黑白任何一方來說,從任何一個可能局面開始,直達最終的最大期望獲勝目數,都有最優解,而且一般都是很多條路。

人類在自身計算力有限的前提下,為了追求獲勝,並進一步在此基礎上追求最優解,不得不依據自身的經驗和邏輯總結和提煉出了無數的下棋規律。

這些規律經歷無數代人的傳承和發展,不斷的揚棄,並一層一層的叠代起來,形成了現在我們所知的圍棋理論。

看到這裏,大家明白了嗎?

從規則定下來開始,圍棋的規律就是客觀存在的了,甚至可以說是客觀真理。

而人類的圍棋理論,是基於自身經驗和邏輯的總結和推演,是主觀的,未必與客觀真理完全相符的。

一直以來,在人類當中,越是擅長在棋盤上戰勝他人的人,也即棋力越強的人,自然也就是掌握和踐行規律越多越合理的人。

甚至可以說,是離真理越近的人。

讓我們想象一下,有一位能夠窮盡圍棋所有變化的「圍棋上帝」,能夠獲知將所有棋局導向最大期望勝利的全部最優途徑,那他也就能在任何局面下下出最優解。

這最優解,就是我們俗稱的「神之一手」。

無數代人類所追求的每個局面下的最佳一手,也就是最能導向勝利的一手,就是這個「神之一手」。

對「神之一手」的追求,也即單個局面最優解的追求,叠代起來也就組合成了對全域最優解的追求。

人類對「神之一手」的追求,歸根結底是對棋盤上的真理的追求。

我們人類有時候也能下出「神之一手」,雖然我們並不確定那到底是不是「神之一手」。

但我們知道,如果是這位代表客觀真理的「圍棋上帝」來下,它的每一手,都將是「神之一手」。

人力有窮,而人的創造力無窮。

有一天,我們創造出了計算力遠大於自身的計算工具,我們可以憑借其更好的追求「神之一手」,更好的追求每個局面下乃至全域的最優解,更好的追求棋盤上的客觀真理。

那我們會因為自己沒有工具計算的更快更準而放棄對真理的追求嗎?

我們派工具去追求真理,難道最終不是為了自己更好的獲知真理嗎?

難道我們只是讓工具自己去追求真理嗎?

我們制造天文望遠鏡,難道是為了讓望遠鏡自己接收光線,讓它自己去「看」星空嗎?

難道不是為了讓我們自己看的更遠嗎?

我相信,人類渴求真理的好奇心永遠都不會停止前進。

而僅就圍棋來說,哪怕只是在19*19路的圍棋盤上,這空間也足夠人類窮盡整個生存歷史時長都無法全部探明。

-

多元化,不僅是人類社會不斷繁榮的象征,更是整個世界降低存續風險的有效方式。

台北的圓山飯店有這樣一桌菜:

有田園和風活鮑魚、松茸三寶魚翅盅、蒜蓉鮮露蒸大明蝦、壕皇鵝掌燒花膠、澳洲禦制牛小排、金華火腿海鮮皇、天麻雪蛤蒸烏雞、原籠櫻花蝦東坡骨米糕等八個菜。

現在,假設你最喜歡吃的是澳洲禦制牛小排,那麽你是願意吃上面那個八個不重樣菜的一桌呢,還是願意吃只有八份你最喜歡吃的澳洲禦制牛小排、而別的什麽都沒有的一桌呢?

我想一般人都不會給出第二種答案吧。

其實,這在微觀經濟學的消費者理論中,是一個非常簡單的現象。

如果你對這個理論感到陌生,不妨看看上面的這張圖。

圖中橫軸和縱軸分別代表一位消費者小石頭喜歡或者需要的兩種商品。

而I1、I2、I3這三條曲線,則代表小石頭個人偏好的無差異曲線,經濟學理論和行為學研究實踐都指出,絕大多數這種時候人的無差異曲線都是如圖中這樣下凸的。

這三條曲線從低到高,分別代表了小石頭不斷提升的滿足感。

而直的線段AB,表示他的預算集,也就是他在能力範圍內能夠得著的消費選擇。

而A、B、M、N、C等五個點,就是他在能力範圍內的五種代表性消費選擇。

A點顯然表示小石頭把所有錢都花在X2而一點X1都不買,而B點則完全反之。我們完全看不到這兩個點在什麽偏好曲線上,總之肯定是在很低的曲線上。

而M和N則分別代表小石頭將絕大部份的錢花在一種商品上,而只選擇很少的另一種商品。我們可以看到這兩個選擇處在曲線I1上,這是小石頭現在的滿足度。

代表最高滿足的度的選擇在哪裏?

是C,它位於小石頭所能達到的最高偏好曲線I2上,代表小石頭大致均衡的選擇了兩種商品。

這種現象,被大量的消費者行為學研究實踐所支持,並得到了行為心理學上的充分解釋。

對著一張圖啰嗦的講了這麽久,其實不過是這麽一個簡單的道理:

面對大量自己喜好或需要的東西,人類總是傾向於什麽都選擇、什麽都留下一點,而不會將所有資源都孤註一擲的投到某一種東西上,而放棄其他的全部。

也即人類偏好多樣性。

你以為只有人類才偏好多樣性嗎?

其實「上帝」也這樣。

自生命起源以來,從原核生物的時代開始,生命就向著不同的方向前進演化,不斷的前進演化出新的形式,品種變得越來越豐富。

經歷億萬年直到今天,才成為我們所看到的這個擁有豐富物種的生態圈。

越是擁有豐富的物種,越是存在多樣化的前進演化方向,才最能夠在環境變遷時保證生命不被全部摧毀。

在金融學上,這是簡單的分散風險,而造物主顯然很擅長「投資」。

當很多人談論起棋類專案的復雜性時,經常喜歡將幾大棋類放在一起對比。

就現有的世界性智力運動來說,受到公認的有四項棋類運動,而他們的合規復雜度排行為:

圍棋 > 中國象棋 > 國際象棋 > 國際跳棋

棋類運動作為人類追求智力開發的產物,既然圍棋的復雜度最高,那是不是留下圍棋就行了?其他比圍棋簡單的都不要了?

盡管我本人可能屬於圍棋的領域,也希望更多的人可以接觸到圍棋,但我絕不希望活在一個只有圍棋,而沒有象棋和跳棋的世界裏。

甚至連孩童都能懂得這個道理。

隨著科技革命的大爆炸,人類社會中的領域和行業將愈加豐富。

很多人都懼怕著隨著人工智能的發展,很多領域和專案將被「消滅」。

可我認為 會被取代的只有舊行業中的重復性機械勞動,人工智能的發展最終是為了將人從這種勞動中解放出來,從而能有更多的時間精力去做那些更有創造性的工作。

人工智能領域的發展,不是為了「消滅」其他領域,當然也不會「消滅」圍棋。

人工智能相關的程式設計師和科學家們,要做的是創造新事物並改變世界,而不是為了消滅世界或者世界的一部份。

甚至像很多新興的交叉領域一樣,隨著人工智能領域的發展,它和圍棋領域的重疊也會加強,甚至成為一個真正的交叉領域。

Google和Deepmind傾盡全力發展人工智能圍棋程式,不是僅僅為了在圍棋盤上創造出能擊敗人類的人工智能程式,而是為了借助圍棋為工具來開發未來的「通用機」。

而面對圍棋,就像曹政老師一直提醒我們的那樣,是「降維打擊」。

但「降維打擊」只是事實全貌的一面而已。

最近,已經有多位機器學習領域的朋友主動對我說,將來如果有條件,很願意參加將深度神經網絡習得的圍棋規律轉譯給棋手們的專案,同時他們也表示,這對人工智能領域本身也是極其重要的課題。

破解DNN的「黑盒」內容,的確對整個人類都非常重要。

這不僅將深刻的影響人工智能領域和圍棋領域,而早晚會影響到其他的領域,直至世界的方方面面。

當我將這些話轉述給一些職業棋手時,他們大多感到非常激動。

而其實一小部份圍棋界乃至其他棋界的人士在很早之前,就已經意識到了這個交叉領域的重要意義,並親自參與甚至投身到了相應的研究和討論中去。

比如當年的陳誌行教授,曾經的俞斌九段、余平六段,近幾年的李喆六段等人,還有大量轉入程式設計師領域的曾經的沖段少年。

甚至連這次的AlphaGo背後的男人哈薩比斯和黃士傑等,也都有棋手背景,要麽是國象大師,要麽是圍棋的業余高段。

輿論中的一些表面上的對立只是兩個領域中,少數有話語權的偏激人士半當真半炒作的種下的種子,而又經過大量媒體誘導宣傳造成的假象。

將來,在這個交叉領域,將充滿共識與合作。

人工智能的發展不會破壞或降低人類社會的多樣性,而只會反之。

-

不斷對內追求自我提升的主觀願望,是人類之所以前進演化為人類的重要原因。

奧林匹克格言「更快、更高、更強」是這種主觀願望的一種最為簡單粗暴的表達方式。

而在此之上,其實還有奧林匹克精神所定義的「理解、友誼、團結和公平競爭」。

簡單粗暴的競爭,為什麽還會有後面這種虛化的精神追求呢?

其實這種追求在東方哲學中,自古至今都是重要的內容。

不論儒家對內的自我提升和個人修養,道家追尋的內心寧靜和順法自然,還是墨家恪守的道義、釋家追求的頓悟,都是在不斷的追求個人精神力乃至整個精神境界的提升。

因此 人類對自我提升的追求,不但有體力鍛煉的追求,還有智力鍛煉的追求,以及精神力鍛煉的追求。

人類互相之間的競爭,最終追求的是戰勝自我。

個人的戰勝自我意味著進步,而人類整體的戰勝自我則意味著前進演化。

為什麽我們創造出會下圍棋的人工智能程式,然後又會去跟它比賽?還會努力的戰勝它,並為了戰勝它而感到高興?

這並不是說人類是自相矛盾的動物,一邊前進一邊拒絕前進,而是這壓根就是兩個維度的問題。

程式設計師們創造出人工智能,是對不斷提升人類創造力的追求;而棋手乃至運動員們自我鍛煉並參加比賽,是對提升體力、智力和精神力等純身體能力的追求。

正如我們跳高時越過了自己擺好的桿子,我們難道不會覺得高興嗎?

而當李世石在身心俱疲、壓力如天,同時幾乎所有人對他感到絕望時,他卻仍然以堅韌的意誌力和強大的實力不懈的追趕,在絕境的狹縫中覓得生機,用「神之一手」從更強大的對手手中奪得了一盤寶貴的勝利,並在這比賽過程中挑戰了人類自身的極限,這難道不是人類追求自我提升的最好表現嗎?

我們為此感到感動,對此表示崇敬和贊揚,並不意味著對對手的貶低和仇視。

不急左就急右,認為世界是非黑即白的,所有立場都是對立的,這是幼稚的孩子氣。

圍棋除了爭勝之外,代代傳承的棋道規範也是極為重要的內容,而棋道規範的核心就是尊重。

這尊重包括尊重對手、尊重自己,還有尊重圍棋、尊重一切存在。

未來,我們還將不斷的創造出新的更強的人工智能圍棋程式;

我們還將繼續與之比賽,努力的戰勝它,並尋找它的毛病和弱點;

我們還將繼續修正和彌補這些毛病,讓人工智能變的更強;

我們還將向人工智能學習,以讓自己變的更強;

更強的我們還與更強的人工智能不斷競爭,以追求更多的自我提升。

以上過程將在未來的歷史中迴圈往復,其存在的長期性在於其邏輯是自洽的。

因此競技圍棋永不會褪色,人類永遠不會放棄借助圍棋追求自我提升。

而人工智能,將成為我們憑借的更好工具。

人工智能,絕不會成為人類追求自我提升的阻礙,而只會給我們帶來新的工具和標桿。

人工智能在棋盤上戰勝人類,也絕不會磨滅人類在棋盤上追求將自己變得更強的願望,而只會成為我們鍛煉自身的良好工具。

-

你問我圍棋的未來如何,這就是我的答案。

也有朋友曾提醒過我,你是不是過於樂觀了?

可我一向都是這樣樂觀。

我堅信所有的愚昧、偏見、傲慢、誤解與疑惑都終將湮沒在歷史的塵埃中,留下的只有人類的進步。

最後,我想要恭喜Google、Deepmind和昨天剛被授予名譽九段的AlphaGo。


AlphaGo「九段」,歡迎來到這個世界並加入我們。


-

於「天啟」之後的丙申年辛卯月丁酉日