當前位置: 華文問答 > 科學

量子深度學習會給我們帶來哪些變化?

2022-11-16科學

在AlphaGo擊敗人類圍棋玩家之後,深度學習大熱,特別是過去幾年來,深度學習在眾多電腦視覺任務、nlp、語音辨識上勢如破竹,全面超越傳統方法。比如目標辨識、機器轉譯和圍棋遊戲等。

實際上,深度學習在凝聚態物理學中也掀起了一番熱烈討論和嘗試。它可以做實驗數據的處理,可以進行機器學習勢場模型的模擬和求解,也有工作研究了用AI進行分子和晶體結構的分類和預測,進行電子密度的學習等。

而關於量子深度學習會帶來哪些變化,這裏先從深度學習的 基本思想 談起。

深度學習又稱為表征學習。即大數據驅動層次化的機器學習模型,以自動獲取物件的向量化的表達,從而為我們所處的現實世界和問題進行建模。

深度神經網絡成功的一個關鍵因素在於:它的網絡足夠深。大量非線性網絡層的復雜組合,能對原始數據在各種抽象層上提取特征。因此 更直觀地來看,深度學習的基本思想就是模擬人腦的資訊處理機制,希望能夠對自然資訊,尤其是聲音、語言、文字、影像進行很好的處理 。而這些是傳統的電腦方法難以做到的。

但是目前深度學習對於人腦的知識處理機制和推理機制了解的還不夠,同時也實作的不夠。實際上,網絡的基本結構不僅包含神經元突觸和突觸的連線機制,相關的學習激勵和準則(主要是Hebb學習規則),同時也包含神經元的種類個數,神經網絡的層數、連線的結構,前向反饋等等。所有這些基本結構和機制對神經網絡的效能起著非常重要的作用。

總而言之,由於深度學習模型網絡過深、參數多、復雜度高等特性,模型做出的決策及中間過程讓人類難以理解。而神經網絡主要是透過學習和最佳化來實作對數據的計算處理,從而產生了 對海量大數據樣本的訓練問題、稀疏編碼與表征問題、泛化問題、可解釋性問題和魯棒性問題

那麽,這些問題如何去解決呢?

首先是 對數據的感知 。也就是說我們如何透過稀疏編碼和表征解決這樣的問題。第二,如何 表證更復雜的數據 ,而不僅僅是簡單的數據,比如小樣本、復雜的多媒體跨域數據等等。第三,我們要 學習和最佳化 模型來解譯這些數據,對其蘊含的規律進行了解,並透過神經網絡獲得滿意的解。第四,深度學習處理的是一 個物理問題 ,與場景有關。第五,現有的網絡結構是否能夠模擬 大腦資訊和知識處理的生物機制 。第六,大腦的 知識處理機制和先驗 是人腦資訊處理的重要的組成部份,如何嵌入現有的深度學習結構、學習與最佳化中。第七,如何 實作對問題場景的感知、表征、學習與結構最佳化的高效套用 ,而不僅僅是對目標的簡單檢測、分類和辨識。

事實上,深度學習不僅僅是計算與訓練問題,而更重要是類腦感知與認知 ,包含編碼、表征、學習、最佳化、推理、決策、行動。

所以,人工智能的下一個目標是從模仿認知學習,轉向解決一直存在的大規模科學計算問題。

這時,量子的威力就顯現出來了。

量子力學是物理學中非常重要的領域之一。從1900年的普朗克公式到愛因斯坦兩獲諾貝爾獎的廣義相對論和狹義相對論,到楊振寧的楊.米爾斯理論,以及量子纏結或者叫量子資訊,所有這些量子力學的發展的過程都有力地推動和改變了這個世界的發展。

經典力學主要是研究運動與時空相對性的規律,而量子力學卻認為,世界的執行並不確定,我們最多只能預測各種結果出現的概率;一個物體可以同時處於兩個相互矛盾的狀態中。簡單的說,量子力學認為你可以一邊封在小區裏,一邊封在公司裏(這正是量子力學最魔幻的地方)。

量子力學態疊加原理使得量子資訊單元的狀態可以處於多種可能性的疊加狀態,從而導致量子資訊處理從效率上相比於經典資訊處理具有更大潛力。以電腦為例,普通電腦中的2位寄存器在某一個時間僅能儲存4個二進制數(00、01、10、11)中的一個,而量子電腦中的2位量子位(qubit)寄存器可同時儲存這四種狀態的疊加狀態。隨著量子位元數目的增加,對於n個量子位元而言,量子資訊可以處於2中可能狀態的疊加,配合量子力學演化的並列性,處理速度要比傳統電腦更快。

關於量子計算工作原理的一個更通俗的解釋是:量子位元可以制備在兩個邏輯態0和1的相幹疊加態,即它可以同時儲存0和1。考慮一個N個物理位元的記憶體,若它是經典記憶體,則它只能儲存2^N個可能數據當中的任一個,若它是量子記憶體,則它可以同時儲存2^N個數,而且隨著N的增加,其儲存資訊的能力將指數上升。例如,一個250量子位元的記憶體(由250個原子構成)可能儲存的數達2^250,比現有已知的宇宙中全部原子數目還要多。

在電腦中,由於數學操作可以同時對記憶體中全部的數據進行,因此,量子電腦在實施一次的運算中可以同時對2^N個輸入數進行數學運算。其效果相當於經典電腦要重復實施2^N操作,或者采用2^N個不同處理器實行並列操作。由此,量子電腦可以節省大量的運算資源。

可見,量子計算是解決傳統計算瓶頸問題的重要途徑之一。目前主要有兩個方面的套用:一是模擬量子系統,在材料科學、量子化學、藥物發現等領域人們需要用大量的計算資源來模擬量子系統,量子電腦用來做這樣的計算最自然最直接;二是用於幫助現在互聯網公司都需要做的計算,比如機器學習的提速,基於量子硬件的機器學習演算法,加速最佳化演算法和提高最佳化效果等。

和量子計算的原理類似,量子力學的基本的原理和思想,用於神經網絡構造神經網絡的計算,或者人工智能中間的學習計算和最佳化問題,就是一種自然的結合。受量子的非線性,疊加,纏結,高度的並列性和二值原理,以及它的非線性處理問題的方式啟發了各種神經網絡模型,包括量子神經計算、Group 演算法、量子小波變換、量子遺傳演算法、量子點的神經網絡模型、量子複制原理、量子電腦、量子前進演化演算法,以及超導的量子計算處理器和現在最新的在量子通訊、量子安全、量子密碼等領域的套用的典型的成果。

其中,量子智能計算更是量子通訊、量子傳感、量子計算、量子密碼等領域的核心之一。在量子態的表現上,是相幹、纏結、疊加和不可複制,而它在希爾伯特空間的表征為復向量的空間,具有內積,範數,完備性和張量的表達。量子機器學習的科學思想就是期望利用疊加、纏結、相幹、並列等量子特性。透過將機器學習演算法量子化,或者構造量子的學習演算法,使我們能夠對數據先驗進行表征、推理、學習和聯想。用這四種性質來實作新的計算、新的學習、新的最佳化和新的推理。

量子深度學習不僅包含有量子神經計算、量子點的神經網絡,更包含有量子的細胞網絡,量子的感知器、量子的自組織網絡、量子的摺積網絡和量子的波爾茲曼機。量子的深度網絡模型不僅有基於測量的、基於感知的,基於量子點的,同樣也有基於量子電路的、量子位元的和量子隨機遊走的模型。所以各種機理都可以用來構造相應的模型。

量子機器學習近年來得到了業界比較大的關註。CNCC大會上有學者曾分享過一個研究,即考慮如何基於量子計算技術提升生成對抗網絡(GAN)的效能。例如提出一個量子生成對抗網絡模型(QGAN),該模型是一種經典-量子混合架構,其中以參數量子電路作為生成器,以經典神經網絡作為區分器。這裏所提出的QGAN具有的潛在優勢有兩個:一是具有內在的生成離散數據的能力,而經典GAN由於梯度消失問題並不擅長生成離散數據;二是避免了目前大多數量子機器學習演算法所面臨的輸入/輸出瓶頸問題。

說白了,深度學習只有從源頭出發,從基礎出發,才能實作創新和套用。而對於 源頭我們就不能不提及生物機理,物化機理和數學的建模表征,演算法的實作,以及在硬件上的部署能力 。這裏面就包括了量子深度學習的探索和發展。