當前位置: 華文問答 > 數位

如果百年後深度學習最終有了公認的數學理論作為基礎,能解釋實驗中的各類玄學,那這個理論會長什麽樣子?

2021-12-29數位

我鬥膽想說一句,我個人認為田老師的提問裏有一個誤區。

首先聲明,我非常尊敬田老師,而且估計田老師這個提問也沒有太細想,所以我並沒有任何想要冒犯的意思。萬望田老師對我這個小輩多多包涵。

但是我覺得這個誤區在目前的ml群體裏普遍存在。尤其是可以從ml頂會裏面甭管什麽paper都得扯上點理論這一現象中就可以看的出來。

所以,我認為有必要將其指出來。

大家都說,理論不能解釋所有問題。這個當然沒錯,但是大家有沒有想過:

其實理論本來就不應該試圖解釋所有問題。

若幹年前,我聽一門地理課。

第一節課,老師希望大家對地圖有個新的認識。

為此,他提出了一個哲學性很強的問題: 模型(model)是什麽?

他說,模型是對於現實的適當抽象、簡化。某種程度上,模型註定是片面的。

比如說吧,你可以在有的地圖裏讀出人口的遷徙,在有的地圖裏讀出收入的差異,在有的地圖裏讀出山川水文的變化,或者在有的地圖裏讀出某種資源的分布。

但是每一個地圖都不可能包含所有的東西。

那這種不全面是一種缺憾嗎? 他問。

不是的,他自己回答了這個問題。

就是因為這個模型只包含了一部份的東西,你才能清楚地從中看出一定的趨勢,得出一個big picture。

而當你試圖往模型裏面塞進太多東西,甚至妄想一比一復刻的時候,模型就失去了意義。

試想,如果說你面前的地圖裏面每個國家的所有資訊都包括了:收入,人口,山川,礦產分布,是否加入北約,是否曾經是前社會主義國家,,是否曾經發生過戰爭,等等等等。

那你還能看出來什麽趨勢麽?

來一句有些神叨的話吧,當你的眼前有太多東西的時候,你反而什麽都看不到。

所以,就像老師說的,模型的意義就在於他是一種合理的抽象和簡化。

而往模型裏塞進過多的東西的行為,很多時候並不是在改善這個model,

you are simply overwhelming the model。 (也就是給模型過度負荷,但我覺得這裏用英文表達最貼切。)

在我眼中,理論和地圖一樣,也是一種模型。(這裏我覺得不要理解得太狹義)

如果說往地圖裏塞入太多資訊算是在overwhelm map的話,現在頂會上試圖什麽東西都搞點理論做法的行為就是在overwhelm theory。

我不覺得理論對套用一點用都沒有。

相反,我認為好的理論不僅僅是for its own sake,也可以對套用起到指導作用。

在很多學科確實是這樣的,我覺得cs這邊以此為目標也是好事。

但是,請註意,理論起到的是指導作用,並不是像菜譜一樣把每一步都告訴你。

我覺得理想情況是這樣的。當你在解決一個問題時候,理論能給你一個方向,告訴你這個方向可以試一試,為什麽,那個方向可能比較難,為什麽。

當你確定了一個方向的時候,剩下的很大程度上是和手頭問題相關的engineering的工作。

在我看來,這些engineering的東西壓根不需要,也不應該和理論攪到一起。

因為既然是起到了指明方向的作用,那就必須盡可能地清楚。

打個比方吧。你去參考一下兩種指路方式。

A:你盡量往左邊走,那裏會比較平坦,而且還有補給站。你要避開右邊,那裏有一片荊棘。

B: 你先來一個三百六十度的湯瑪斯全旋,在全旋到一百五十度的時候你能看到那邊有一個房子,然後你記錄下那個房子的方位,朝著那個房子走,然後中間你要像馬利奧一樣蹦跳一百下(此處省略一千字) 為什麽呢,因為有一個古老的傳說,當你湯瑪斯全旋的時神就會幫助你(此處再省略一千字)。

反正我是覺得更清楚的A 比較有用。

希望大家能夠get到我可能比較冷的幽默感。 如果說不能,我就給這段刪掉吧,哎。

我就是想要闡述清楚這一性質的重要性。

當你試圖每一個工程方法、玄學技巧都去解釋的時候,那這個理論必然不清楚,也因而使得理論失去了對套用的指導意義。

當然,我也不是說要為了清楚不擇手段,只看toy case,一點實用性和generality都不管。

我想說的是,做理論應該要盡量達到清楚、對現實有意義、和generality的一個均衡。即使達不到,這也應該是一個目標。

在我看來,這是理論工作的難點,但也是有魅力的地方。

我上面的這一段話肯定是沒法幫大家發paper的,所以呢要是有同學覺得是沒用的廢話,那我也認沒有意見。

而且我人微言輕,說什麽也起不了什麽波瀾。

但是,如果真的要我許個願的話,我著實希望:

頂會上那種什麽都扯個理論的風潮我真心能夠盡早停止。

因為在我看來,這不光對專門搞套用的同學不是很友好,而且

it is simply overwhelming theory。

最後,還是想表達一下對田老師的尊敬,以及希望大家工作學業順利。