摘要神經(jīng)網(wǎng)絡(luò)量子態(tài)是由人工神經(jīng)網(wǎng)絡(luò)所表示的量子態(tài)。得益于機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)近年來(lái)取得的突破性進(jìn)展,神經(jīng)網(wǎng)絡(luò)量子態(tài)的研究得到了廣泛的關(guān)注,成為當(dāng)前的熱點(diǎn)前沿方向。文章將介紹不同的神經(jīng)網(wǎng)絡(luò)量子態(tài),其物理性質(zhì)與典型應(yīng)用場(chǎng)景,最新進(jìn)展,以及面臨的挑戰(zhàn)。
01 引 言
人工智能主要有三條發(fā)展路線:符號(hào)主義、連接主義與行為主義[1]。人工神經(jīng)網(wǎng)絡(luò)是連接主義的基石,也是最近幾年深度學(xué)習(xí)取得突破進(jìn)展的關(guān)鍵要素之一。它是受到生物大腦中信息處理模式的啟發(fā)而提出的,最早可追溯到1943年由心理學(xué)家W. S. McCulloch與數(shù)理邏輯學(xué)家W. Pitts提出的神經(jīng)元模型[2]。當(dāng)前,基于神經(jīng)網(wǎng)絡(luò)的人工智能技術(shù)正在給人類文明的方方面面帶來(lái)革命性的改變[3]:從語(yǔ)音、圖像識(shí)別到引力波、黑洞探測(cè),再到數(shù)據(jù)挖掘、自動(dòng)駕駛、醫(yī)學(xué)診斷、證券市場(chǎng)分析,等等。2018 年,計(jì)算機(jī)科學(xué)的最高獎(jiǎng)——圖靈獎(jiǎng)也被授予三位人工智能科學(xué)家Yoshua Bengio,Geoffrey Hinton與Yann LeCun,以表彰他們?cè)谙嚓P(guān)領(lǐng)域所做的突出貢獻(xiàn)[4]。
另一方面,量子力學(xué)是現(xiàn)代物理最重要的基礎(chǔ)理論之一[5]。其重要性廣泛體現(xiàn)在我們的日常生活和科學(xué)探索中:從以電子計(jì)算機(jī)為代表的半導(dǎo)體工業(yè)到新奇的超導(dǎo)現(xiàn)象,從隨處可見(jiàn)的化學(xué)電池到宇宙中神秘的黑洞,世間萬(wàn)物的變化規(guī)律都與量子力學(xué)密切相關(guān)。
然而,對(duì)量子系統(tǒng)尤其是量子多體系統(tǒng)的研究是非常困難的。實(shí)際研究中能夠嚴(yán)格解析解決的問(wèn)題很少,對(duì)于絕大部分問(wèn)題的求解,我們只能依賴于數(shù)值方法。對(duì)于最一般的情形,數(shù)值方法需要消耗指數(shù)量級(jí)的計(jì)算資源,這對(duì)于規(guī)模較小的物理系統(tǒng)是可行的,但如果系統(tǒng)規(guī)模變大,這一指數(shù)級(jí)的要求在經(jīng)典計(jì)算體系下就難以滿足了[6]。1998年諾貝爾化學(xué)獎(jiǎng)得主Walter Kohn將這一問(wèn)題描述為“指數(shù)墻(exponential wall)” 困難[7]。為此,物理學(xué)家做了大量的努力,發(fā)展了一系列計(jì)算方法,著名的蒙特卡羅算法以及重正化群算法就是典型代表。但是這些方法并不是通用的,分別有著各自的適用條件。比如蒙特卡羅算法在應(yīng)用于一些有阻挫系統(tǒng)時(shí)會(huì)出現(xiàn)符號(hào)問(wèn)題,從而使得算法需要指數(shù)級(jí)的時(shí)間;而密度矩陣重正化群算法一般僅適用于一維低糾纏熵系統(tǒng)。
在人工智能領(lǐng)域中,一個(gè)類似的問(wèn)題是維度災(zāi)難(curse of dimensionality)。維度災(zāi)難最早是由動(dòng)態(tài)規(guī)劃先驅(qū)、著名應(yīng)用數(shù)學(xué)家 Richard E. Bellman提出,描述了高維與低維數(shù)據(jù)集截然不同的性質(zhì)對(duì)計(jì)算問(wèn)題帶來(lái)的影響[8]:隨著數(shù)據(jù)維度增加,有限規(guī)模的數(shù)據(jù)在空間中的分布會(huì)逐漸稀疏,從而失去統(tǒng)計(jì)意義。這就要求在一般情況下,我們需要非常大的數(shù)據(jù)規(guī)模來(lái)獲得數(shù)據(jù)集的統(tǒng)計(jì)特征,但是這會(huì)對(duì)計(jì)算資源帶來(lái)嚴(yán)重負(fù)擔(dān)。經(jīng)過(guò)多年的發(fā)展,人工智能領(lǐng)域提出了許多用于處理高維問(wèn)題的方法和工具。人工神經(jīng)網(wǎng)絡(luò)就是一個(gè)應(yīng)用非常廣泛的例子,可以在一定程度上緩解維度災(zāi)難帶來(lái)的困難。簡(jiǎn)單來(lái)說(shuō),人工神經(jīng)網(wǎng)絡(luò)可以看成是一個(gè)普適的函數(shù)擬合器。通過(guò)調(diào)節(jié)網(wǎng)絡(luò)參數(shù),它可以用來(lái)擬合任何光滑函數(shù)[9]。
由于指數(shù)墻困難和維度災(zāi)難的相似性,一個(gè)自然的想法是可以用神經(jīng)網(wǎng)絡(luò)處理復(fù)雜的量子問(wèn)題。如可以用神經(jīng)網(wǎng)絡(luò)識(shí)別不同的量子物態(tài)以及研究它們之間的相變 (參見(jiàn)《物理》2017年第9期蔡子的專題文章)。另一方面,我們也可以用神經(jīng)網(wǎng)絡(luò)來(lái)表示量子態(tài),其主要思想是把神經(jīng)網(wǎng)絡(luò)當(dāng)成變分波函數(shù),通過(guò)調(diào)節(jié)網(wǎng)絡(luò)參數(shù)來(lái)逼近目標(biāo)波函數(shù)(如多體系統(tǒng)的基態(tài)),進(jìn)而求解所關(guān)心的物理問(wèn)題。傳統(tǒng)的量子多體變分波函數(shù)方法需要物理學(xué)家針對(duì)所求解的問(wèn)題設(shè)計(jì)特定的變分函數(shù),而神經(jīng)網(wǎng)絡(luò)量子態(tài)方法可以使用相對(duì)普適的結(jié)構(gòu),對(duì)于先驗(yàn)知識(shí)的依賴程度較低。此外,人工智能領(lǐng)域里發(fā)展的一些優(yōu)化神經(jīng)網(wǎng)絡(luò)的方法也可以用于神經(jīng)網(wǎng)絡(luò)量子態(tài),提高算法效率。
近年來(lái),通過(guò)神經(jīng)網(wǎng)絡(luò)量子態(tài)的方法求解量子多體問(wèn)題受到了廣泛關(guān)注[10—12]。當(dāng)前,這是一個(gè)非?;钴S的前沿研究方向。本文將介紹不同神經(jīng)網(wǎng)絡(luò)量子態(tài)的物理性質(zhì)與典型應(yīng)用場(chǎng)景,以及此方向的最新進(jìn)展。所涉及的神經(jīng)網(wǎng)絡(luò)包括受限玻爾茲曼機(jī),深度玻爾茲曼機(jī),前饋神經(jīng)網(wǎng)絡(luò),與循環(huán)神經(jīng)網(wǎng)絡(luò)等。典型應(yīng)用包括:求解量子多體系統(tǒng)的基態(tài)及動(dòng)力學(xué)演化,探測(cè)量子非定域性,量子層析,以及計(jì)算交錯(cuò)時(shí)序關(guān)聯(lián)函數(shù)等。希望通過(guò)本文的討論,讀者能感受到神經(jīng)網(wǎng)絡(luò)量子態(tài)的魅力。眾所周知,基于神經(jīng)網(wǎng)絡(luò)的智能程序 AlphaGo[13]與 AlphaFold[14]分別在圍棋與預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面取得了里程碑式的突破。我們期望神經(jīng)網(wǎng)絡(luò)量子態(tài)能把這些突破延續(xù)到解決復(fù)雜的量子多體問(wèn)題中來(lái)。
02 量子態(tài)的神經(jīng)網(wǎng)絡(luò)表示
在量子力學(xué)中,一個(gè)封閉的、不與外界產(chǎn)生關(guān)聯(lián)的物理系統(tǒng)的全部可能狀態(tài)組成一個(gè)希爾伯特空間,每個(gè)特定的物理狀態(tài)由該空間中的一個(gè)矢量描述。希爾伯特空間在數(shù)學(xué)上是線性空間,因此在確定其基矢之后,每一個(gè)物理狀態(tài)對(duì)應(yīng)的矢量可以表示為選定基矢量的線性疊加。在實(shí)際物理問(wèn)題中,我們經(jīng)常需要處理包含多個(gè)子系統(tǒng)的情況,系統(tǒng)的希爾伯特空間維數(shù)為各子系統(tǒng)對(duì)應(yīng)空間維數(shù)的乘積[15]。比如,假設(shè)我們需要描述包含N個(gè)自旋粒子的量子系統(tǒng),每一個(gè)粒子自旋可以取上下兩種可能,其對(duì)應(yīng)希爾伯特空間維數(shù)為 2,那么整個(gè)系統(tǒng)的自旋狀態(tài)就有 2N 種可能,從而總希爾伯特空間維數(shù)為 2N。因此,表示最一般情況下的波函數(shù)需要指數(shù)量級(jí)的計(jì)算資源。這給數(shù)值求解量子多體問(wèn)題帶來(lái)了極大挑戰(zhàn)。
幸運(yùn)的是,人們關(guān)心的物理狀態(tài)一般還受到某些限制,比如對(duì)稱性的限制或者是某些物理觀測(cè)量的限制,每一個(gè)子系統(tǒng)并不是完全獨(dú)立的,子系統(tǒng)狀態(tài)會(huì)互相影響,從而整體系統(tǒng)可能的狀態(tài)只占據(jù)了希爾伯特空間中的很小一部分。原則上可以針對(duì)不同的物理系統(tǒng),利用具有特定結(jié)構(gòu)的表示方法,在使用相對(duì)較少的計(jì)算資源情況下表示這些物理狀態(tài)[5]。著名的張量網(wǎng)絡(luò)就是一個(gè)典型的例子[16]。物理中一般使用糾纏熵(entanglement entropy)來(lái)刻畫量子系統(tǒng)之間的關(guān)聯(lián)強(qiáng)度。張量網(wǎng)絡(luò)可以有效表示糾纏熵滿足面積定律(即糾纏熵與子系統(tǒng)的表面積成正比)的物理狀態(tài)[17]。在這里,“有效”指的是只需要多項(xiàng)式量級(jí)的計(jì)算資源。另一個(gè)例子就是本文將要重點(diǎn)介紹的神經(jīng)網(wǎng)絡(luò)量子態(tài)。
圖1 神經(jīng)網(wǎng)絡(luò)量子態(tài)示意圖 (a) 生物大腦中的神經(jīng)元;(b)感知機(jī);(c)生物神經(jīng)網(wǎng)絡(luò);(d) 人工神經(jīng)網(wǎng)絡(luò);(e) 量子態(tài)的神經(jīng)網(wǎng)絡(luò)表示
神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)(神經(jīng)元)及它們之間的相互連接構(gòu)成,如圖1所示。每個(gè)節(jié)點(diǎn)包含一種特定的輸出函數(shù),稱為激活函數(shù)。每?jī)蓚€(gè)節(jié)點(diǎn)間的連接代表對(duì)于通過(guò)該連接信號(hào)的加權(quán)值,稱為權(quán)重。神經(jīng)網(wǎng)絡(luò)就是通過(guò)這種方式來(lái)簡(jiǎn)單模擬人類的大腦。網(wǎng)絡(luò)的輸出則取決于網(wǎng)絡(luò)的結(jié)構(gòu)、連接方式、權(quán)重和激活函數(shù)。神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元通常被排列成層狀結(jié)構(gòu),第一層被稱為輸入層,數(shù)據(jù)由這一層輸入。最后一層被稱為輸出層,中間層被稱為隱藏層。如果一個(gè)神經(jīng)網(wǎng)絡(luò)有多于兩層的結(jié)構(gòu),我們通常稱其為深度神經(jīng)網(wǎng)絡(luò),基于此構(gòu)建的機(jī)器學(xué)習(xí)模型稱為深度學(xué)習(xí)。依據(jù)具體網(wǎng)絡(luò)結(jié)構(gòu)和信息傳播方向的不同,神經(jīng)網(wǎng)絡(luò)又可以分為很多種。常見(jiàn)的神經(jīng)網(wǎng)絡(luò)有前饋神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、玻爾茲曼機(jī)、循環(huán)神經(jīng)網(wǎng)絡(luò)等。本質(zhì)上,量子波函數(shù)是一個(gè)函數(shù),而神經(jīng)網(wǎng)絡(luò)是一個(gè)普適的函數(shù)擬合器。因此,我們可以用神經(jīng)網(wǎng)絡(luò)表示量子態(tài)。
2.1受限玻爾茲曼機(jī)
受限爾茲曼機(jī)(restricted Boltzmann machine,RBM)是一類應(yīng)用非常廣泛的神經(jīng)網(wǎng)絡(luò),其在數(shù)據(jù)降維、特征學(xué)習(xí)、圖片生成、自然語(yǔ)言處理等場(chǎng)景中都有重要應(yīng)用[18]。它是一個(gè)兩層的神經(jīng)網(wǎng)絡(luò),其中一層稱為可視層,另一層稱為隱藏層。可視層中的神經(jīng)元可以連接到隱藏層,而同層神經(jīng)元之間不能相連。
考慮一個(gè)由N個(gè)量子比特組成的系統(tǒng),其量子態(tài)的一般形式為
, 其中σ= (σ1,σ2,?,σN) 表示一個(gè)可能的構(gòu)型。ψ(σ) 可以看成是一個(gè)函數(shù),輸入為σ,輸出為一個(gè)復(fù)數(shù)ψ(σ),表示分量對(duì)應(yīng)的振幅和相位信息。如圖2所示,可以用一個(gè)可視層有N個(gè)神經(jīng)元(對(duì)應(yīng)N個(gè)量子比特),隱藏層有M個(gè)神經(jīng)元的RBM來(lái)表示 ψ(σ) [19]
其中
表示隱藏神經(jīng)元的可能構(gòu)型,每個(gè)神經(jīng)元有兩個(gè)可能的取值 σi = ±1 和 hj = ±1,ai,bj與 wij 分別表示網(wǎng)絡(luò)的偏置和連接參數(shù)。為簡(jiǎn)單起見(jiàn),我們稱由受限玻爾茲曼機(jī)所表示的量子態(tài)為RBM態(tài)。
圖2 量子態(tài)的受限玻爾茲曼機(jī)表示
數(shù)學(xué)上可以證明,當(dāng)M取值足夠大時(shí),受限玻爾茲曼機(jī)可以以任意精度逼近任何光滑函數(shù)。因此,原則上量子態(tài)的受限玻爾茲曼機(jī)表示是完備的,任何量子態(tài)都可以用受限玻爾茲曼機(jī)表示。實(shí)際應(yīng)用中,M一般隨N多項(xiàng)式增大,所以RBM表示量子態(tài)所需要的參數(shù)個(gè)數(shù)也是隨N多項(xiàng)式增加,而不是指數(shù)增加。如此,RBM態(tài)在解決某些量子多體問(wèn)題的時(shí)候就可能可以繞過(guò)“指數(shù)墻”困難。
與張量網(wǎng)絡(luò)表示不同,受限玻爾茲曼機(jī)可以有效表示具有大糾纏熵的量子態(tài)[20]。這得益于可視神經(jīng)元與隱藏神經(jīng)元的長(zhǎng)程連接。事實(shí)上,我們可以解析構(gòu)造一個(gè)滿足糾纏熵體積定律(即糾纏熵與子系統(tǒng)體積成正比)的RBM態(tài),其所包含的參數(shù)個(gè)數(shù)隨N僅為線性增加。而如果用常規(guī)的張量網(wǎng)絡(luò)表示同樣的量子態(tài),所需的參數(shù)個(gè)數(shù)隨N是指數(shù)增加的。這體現(xiàn)了神經(jīng)網(wǎng)絡(luò)在表示大糾纏熵的量子態(tài)方面的獨(dú)特優(yōu)勢(shì)。
如果我們限制只有近鄰的可視神經(jīng)元能連接到同一個(gè)隱藏神經(jīng)元,這樣可以進(jìn)一步降低參數(shù)規(guī)模及優(yōu)化難度,所得到的量子態(tài)稱為短程RBM態(tài)。由于這個(gè)限制,任意可視神經(jīng)元只關(guān)聯(lián)到其附近的神經(jīng)元。因此,所有短程RBM態(tài)都滿足糾纏熵面積定律。
圖3 受限玻爾茲曼機(jī)表示拓?fù)鋺B(tài) (a)環(huán)曲面碼哈密頓量;(b)基態(tài)的RBM表示;(c)含4個(gè)準(zhǔn)粒子的激發(fā)態(tài)
短程RBM可以嚴(yán)格表示一些有趣的奇異量子態(tài),如拓?fù)鋺B(tài)、超圖態(tài)等。拓?fù)鋺B(tài)的一個(gè)重要例子是環(huán)曲面碼態(tài)(toric-code state)[21],它是 Alexei Kitaev 提出的環(huán)曲面碼哈密頓量(圖3(a))的基態(tài),在拓?fù)淞孔佑?jì)算[22]與量子糾錯(cuò)中極為重要。圖3(b)簡(jiǎn)要描述了環(huán)曲面碼態(tài)的短程RBM表示。在環(huán)曲面碼態(tài)的基礎(chǔ)上,作用弦算符(即由不同格點(diǎn)泡利矩陣張量積所得算符)可以得到系統(tǒng)的激發(fā)態(tài)。如圖3(c)所示,此激發(fā)態(tài)含有4個(gè)準(zhǔn)粒子,分別位于弦算符 P1x 與 P1z兩端。有意思的是,這些激發(fā)態(tài)都可以用短程RBM 嚴(yán)格表示,且所需要的參數(shù)個(gè)數(shù)只隨系統(tǒng)規(guī)模線性增加[23]?;诖?,我們有一個(gè)直接推論,由短程 RBM 表示的環(huán)曲面碼態(tài)及其激發(fā)態(tài)都滿足糾纏熵面積定律。而傳統(tǒng)方法證明此結(jié)論需要涉及比較復(fù)雜的數(shù)學(xué)工具(如商群)。
以上,我們討論了量子系統(tǒng)純態(tài)的 RBM 表示。實(shí)際中的量子系統(tǒng)不可避免地受到環(huán)境的干擾,其狀態(tài)是一個(gè)混合態(tài),需要用密度矩陣算符來(lái)描述。受限玻爾茲曼機(jī)也可以用來(lái)表示混合態(tài)[24]。需要指出的是,為滿足密度矩陣半正定性的要求,表示混合態(tài)時(shí)受限玻爾茲曼機(jī)的參數(shù)需要滿足特定的條件。此外,通過(guò)附加行列式或使用 Grassmann 代數(shù)的方法,受限玻爾茲曼機(jī)也可以用來(lái)表示費(fèi)米子系統(tǒng)的量子態(tài)[25,26]。
2.2 深度玻爾茲曼機(jī)
受限玻爾茲曼機(jī)可以有效表示一些有趣的量子態(tài),但其表示能力有限。例如,它不能有效表示一些可以展示量子優(yōu)勢(shì)(quantum supremacy)的態(tài),如二維團(tuán)簇態(tài)通過(guò)特殊幺正變化所得的態(tài)[27]。這個(gè)結(jié)論可以從直觀上理解,由于受限玻爾茲曼機(jī)簡(jiǎn)單的結(jié)構(gòu),其所表示的量子態(tài)可以通過(guò)有效算法求得。假設(shè)其能有效表示可以展示量子優(yōu)勢(shì)的態(tài),這就意味著經(jīng)典計(jì)算機(jī)可以有效模擬這個(gè)量子態(tài),這與此量子態(tài)可以展示量子優(yōu)勢(shì)是矛盾的。
為加強(qiáng)受限玻爾茲曼機(jī)的表達(dá)能力,可以在原有網(wǎng)絡(luò)上再加一層隱藏層,所得網(wǎng)絡(luò)稱為深度玻爾茲曼機(jī)(deep Boltzmann machine,DBM)。在計(jì)算復(fù)雜度理論中,一個(gè)被普遍接受但至今無(wú)法證明的猜想是復(fù)雜度的多項(xiàng)式層級(jí)不會(huì)塌縮,著名的 P ≠NP 猜想是這個(gè)猜想的一個(gè)特例。在假設(shè)以上猜想成立的情況下,可以證明:DBM相比RBM在表達(dá)能力上可以有指數(shù)級(jí)的優(yōu)勢(shì)。存在一些量子態(tài),如果用RBM表示需要指數(shù)級(jí)的參數(shù), 而DBM只需要多項(xiàng)式規(guī)模的參數(shù)[28]。
2.3 前饋神經(jīng)網(wǎng)絡(luò)
前饋神經(jīng)網(wǎng)絡(luò)是研究最早和最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)之一,也是目前應(yīng)用最廣泛,發(fā)展最迅速的人工神經(jīng)網(wǎng)絡(luò)之一[18]。其神經(jīng)元分層排列,每個(gè)神經(jīng)元只與前一層神經(jīng)元相連。信息從輸入層逐層傳遞到輸出層,單向傳播無(wú)反饋。與受限玻爾茲曼機(jī)一樣,前饋神經(jīng)網(wǎng)絡(luò)也可以用來(lái)表示量子態(tài)[29]。其輸入層所含神經(jīng)元數(shù)目對(duì)應(yīng)所考慮量子系統(tǒng)的粒子數(shù),輸出層為單個(gè)神經(jīng)元,輸出一個(gè)復(fù)數(shù),表示量子態(tài)對(duì)應(yīng)分量的振幅和相位信息。
對(duì)于非常復(fù)雜的量子態(tài),我們可以將波函數(shù)分作兩個(gè)部分:波函數(shù)絕對(duì)值與對(duì)應(yīng)的符號(hào),并分別使用兩個(gè)前饋神經(jīng)網(wǎng)絡(luò)表示。在實(shí)際應(yīng)用中可以觀察到,對(duì)于簡(jiǎn)單的量子態(tài),前饋神經(jīng)網(wǎng)絡(luò)可以準(zhǔn)確學(xué)習(xí)到其對(duì)應(yīng)的符號(hào)規(guī)則;對(duì)于一些復(fù)雜的量子態(tài)前饋神經(jīng)網(wǎng)絡(luò)也能學(xué)習(xí)到比較高的精度,這證實(shí)了利用前饋神經(jīng)網(wǎng)絡(luò)處理量子態(tài)的有效性[29]。
2.4 其他神經(jīng)網(wǎng)絡(luò)
人工智能領(lǐng)域針對(duì)不同的問(wèn)題設(shè)計(jì)了多種多樣的神經(jīng)網(wǎng)絡(luò),原則上所有類型的神經(jīng)網(wǎng)絡(luò)都可以用于表示量子態(tài)。不同的網(wǎng)絡(luò)有不同的結(jié)構(gòu),能有效表示的量子態(tài)以及網(wǎng)絡(luò)訓(xùn)練的時(shí)間復(fù)雜度也不盡相同。在實(shí)際應(yīng)用中,我們可以根據(jù)具體問(wèn)題選擇不同的神經(jīng)網(wǎng)絡(luò)[18]。比如循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)非常適合處理序列數(shù)據(jù),在機(jī)器翻譯、語(yǔ)音識(shí)別以及文本生成等領(lǐng)域有著廣泛的應(yīng)用??梢詫⒍囿w系統(tǒng)中量子比特構(gòu)型視為序列數(shù)據(jù),從而利用循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)表示量子多體態(tài)[30]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)則是另一類被廣泛使用的深度神經(jīng)網(wǎng)絡(luò),適合圖像處理、行為認(rèn)知、遷移學(xué)習(xí)等場(chǎng)景。文獻(xiàn)[31]表明,卷積神經(jīng)網(wǎng)絡(luò)也可以用來(lái)表示量子態(tài),如前面提到的環(huán)曲面碼態(tài)。
03 神經(jīng)網(wǎng)絡(luò)量子態(tài)的應(yīng)用 制備方法
如前所述,人工神經(jīng)網(wǎng)絡(luò)可以非常有效地表示多體量子態(tài),其在量子物理,尤其是解量子多體問(wèn)題中有很廣泛的應(yīng)用。圖4歸納了當(dāng)前神經(jīng)網(wǎng)絡(luò)量子態(tài)的主要應(yīng)用。接下來(lái),我們簡(jiǎn)要介紹部分近期的相關(guān)工作,主要側(cè)重于RBM量子態(tài)的應(yīng)用。
圖4 神經(jīng)網(wǎng)絡(luò)量子態(tài)的應(yīng)用
3.1 求解量子系統(tǒng)基態(tài)和動(dòng)力學(xué)演化
一個(gè)孤立封閉的量子系統(tǒng)可以由哈密頓量描述,其演化過(guò)程滿足薛定諤方程。求解給定哈密頓量的基態(tài)和動(dòng)力學(xué)演化是量子物理中常見(jiàn)的基本問(wèn)題。對(duì)于少數(shù)特殊的模型,如一維伊辛模型(Ising model),其基態(tài)和動(dòng)力學(xué)可以通過(guò)解析的方法嚴(yán)格求解。然而,實(shí)際研究中能夠解析求解基態(tài)和動(dòng)力學(xué)的情況很少,我們需要依賴數(shù)值方法。
利用神經(jīng)網(wǎng)絡(luò)求解基態(tài)和動(dòng)力學(xué)的核心想法是把神經(jīng)網(wǎng)絡(luò)量子態(tài)看成變分函數(shù),通過(guò)梯度下降算法優(yōu)化網(wǎng)絡(luò)參數(shù)求解相應(yīng)問(wèn)題。以受限玻爾茲曼機(jī)為例,G. Carleo 和 M. Troyer 首先求解了幾個(gè)典型的量子磁性模型(如伊辛模型、海森伯模型)的基態(tài)及動(dòng)力學(xué),并與傳統(tǒng)的密度矩陣重正化群等方法進(jìn)行了比較[19]。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)的方法使用較少的參數(shù)就得到了相近精度的基態(tài)能量和動(dòng)力學(xué)演化,這在一定程度上展示了神經(jīng)網(wǎng)絡(luò)方法的優(yōu)越性。
值得指出的是,對(duì)于最一般情形求解基態(tài)和動(dòng)力學(xué)演化可以證明是NP問(wèn)題。因此,神經(jīng)網(wǎng)絡(luò)的方法也不能有效求解所有量子系統(tǒng)的基態(tài)和演化。當(dāng)前的研究表明,其在解決涉及大量子糾纏與高維系統(tǒng)的問(wèn)題中相比傳統(tǒng)方法可能有優(yōu)勢(shì),但是這一優(yōu)勢(shì)還沒(méi)有得到確切的證明。如何判斷給定哈密頓量的基態(tài)和動(dòng)力學(xué)是否可以通過(guò)神經(jīng)網(wǎng)絡(luò)的方法有效求解是此領(lǐng)域里一個(gè)亟待解決的重要問(wèn)題。這一問(wèn)題的解決可能需要發(fā)展新的物理概念和數(shù)學(xué)工具。
3.2 交錯(cuò)時(shí)序關(guān)聯(lián)函數(shù)
交錯(cuò)時(shí)序關(guān)聯(lián)函數(shù)(out-of-time ordered correlator,OTOC)最早由A. Larkin與 Y. Ovchinnikov在1969年研究超導(dǎo)理論時(shí)提出[32]。經(jīng)過(guò)幾十年的發(fā)展,OTOC在表征量子混沌,量子信息置亂(information scrambling),動(dòng)力學(xué)相變等研究中都有重要應(yīng)用。此外,其還可以給通過(guò)Ads/CFT對(duì)偶研究量子引力與黑洞帶來(lái)新的啟示。最近,實(shí)驗(yàn)測(cè)量OTOC也在離子阱、固態(tài)自旋、玻色—愛(ài)因斯坦凝聚等系統(tǒng)中實(shí)現(xiàn)。
考慮量子多體系統(tǒng)中在空間上分開(kāi)的兩個(gè)局域算符 W 與 V ,其對(duì)應(yīng)的OTOC定義為
其中
為W在海森伯繪景中的時(shí)間演化算符。不難看出,OTOC的物理意義是描述一個(gè)局域擾動(dòng)傳播一段時(shí)間后,在另一個(gè)地方被探測(cè)到的物理現(xiàn)象。數(shù)值上,計(jì)算多體系統(tǒng)的OTOC是非常困難的,其復(fù)雜程度要大于基態(tài)或動(dòng)力學(xué)演化的求解。文獻(xiàn)[33]提出了 OTOC 的神經(jīng)網(wǎng)絡(luò)求解辦法,其核心思想是把OTOC看成是兩個(gè)隨時(shí)間演化量子態(tài)的交疊,從而通過(guò)計(jì)算態(tài)的演化與交疊來(lái)求解。
3.3 量子非定域性
非定域性是量子系統(tǒng)一個(gè)非常奇特的性質(zhì),是量子物理與經(jīng)典物理最核心的區(qū)別之一[34]。它描述比量子糾纏更強(qiáng)的關(guān)聯(lián)——任何表現(xiàn)非定域性的量子態(tài)一定是糾纏的,反之則不一定成立。在實(shí)際應(yīng)用中,量子非定域性是構(gòu)建設(shè)備無(wú)關(guān)量子技術(shù),如無(wú)條件安全量子密鑰分配、自認(rèn)證隨機(jī)數(shù)產(chǎn)生器等,不可或缺的資源。對(duì)量子非定域性的思考和研究最早可以追溯到20世紀(jì)初發(fā)生在愛(ài)因斯坦和玻爾之間關(guān)于“上帝是否會(huì)擲骰子”著名爭(zhēng)論[35]。1964年,約翰·斯圖爾特·貝爾(John Stewart Bell,圖5)提出了著名的貝爾不等式[36]。從此,量子非定域性可以通過(guò)實(shí)驗(yàn)測(cè)試貝爾不等式的破壞來(lái)定量刻畫。
圖5 約翰·斯圖爾特·貝爾(John Stewart Bell,1928.6.28—1990.10.1)。圖片來(lái)源于網(wǎng)絡(luò)
然而,由于存在指數(shù)墻困難,在量子多體系統(tǒng)中研究非定域性變得極為不易。在文獻(xiàn)[37] 中,本文作者之一把機(jī)器學(xué)習(xí)的方法引入到了量子多體非定域性的研究中。其核心思想是把在量子多體系統(tǒng)中探測(cè)非定域性的問(wèn)題轉(zhuǎn)化為求解哈密頓量基態(tài)能量問(wèn)題,從而可以利用上述神經(jīng)網(wǎng)絡(luò)量子態(tài)的方法處理。具體來(lái)說(shuō),對(duì)于給定的量子多體系統(tǒng),其所有可能的經(jīng)典關(guān)聯(lián)組成一個(gè)高維空間的多面體,多面體的每一個(gè)面對(duì)應(yīng)一個(gè)貝爾不等式,如圖6所示。初始時(shí),我們隨機(jī)產(chǎn)生一個(gè)RBM量子態(tài),其對(duì)于給定的觀測(cè)量一般只表現(xiàn)出經(jīng)典關(guān)聯(lián)。通過(guò)不斷地優(yōu)化RBM的參數(shù),其所表示的量子態(tài)逐漸超越多面體的一個(gè)面(即破壞對(duì)應(yīng)的貝爾不等式),展示出量子非定域性。值得指出的是,神經(jīng)網(wǎng)絡(luò)量子態(tài)在探測(cè)多體非定域性問(wèn)題中有獨(dú)特優(yōu)勢(shì),可以解決一些用傳統(tǒng)方法無(wú)法解決或極為困難的問(wèn)題,比如計(jì)算隨機(jī)全關(guān)聯(lián)系統(tǒng)貝爾不等式最大破壞值。
圖6 神經(jīng)網(wǎng)絡(luò)探測(cè)貝爾非定域性
3.4求解開(kāi)放系統(tǒng)穩(wěn)態(tài)和動(dòng)力學(xué)
孤立量子系統(tǒng)演化過(guò)程遵循薛定諤方程,而實(shí)際系統(tǒng)往往不可避免地與環(huán)境發(fā)生作用,因此很多情況下并不能當(dāng)作孤立系統(tǒng)處理。對(duì)于與環(huán)境弱耦合的開(kāi)放系統(tǒng),其狀態(tài)的演化可以近似認(rèn)為僅與當(dāng)前狀態(tài)相關(guān),而與之前的演化過(guò)程無(wú)關(guān),從而通過(guò)玻恩—馬爾可夫近似,可以導(dǎo)出開(kāi)放系統(tǒng)所滿足的演化方程,即Lindblad主方程[38]:
其中L 為劉維爾超算符,H 表示系統(tǒng)哈密頓量,ρ 為密度矩陣,cj 與γj分別表示耗散算符與耗散強(qiáng)度。
與孤立系統(tǒng)類似,神經(jīng)網(wǎng)絡(luò)的方法也可以用來(lái)求解開(kāi)放量子系統(tǒng)的穩(wěn)態(tài)與動(dòng)力學(xué)演化,此時(shí)需要使用密度矩陣的神經(jīng)網(wǎng)絡(luò)表示[24]。與孤立系統(tǒng)不同的是,開(kāi)放量子系統(tǒng)的能量不再是守恒量,因此不能通過(guò)對(duì)能量的變分來(lái)求解。但是,我們可以考慮優(yōu)化變分近似演化與精確演化之間的距離或者通過(guò) Choi—Jamio?kowski 同構(gòu)把主方程轉(zhuǎn)化為有效哈密頓量方程來(lái)求解。與之相關(guān)地,我們?cè)谖墨I(xiàn)[39]中進(jìn)一步把神經(jīng)網(wǎng)絡(luò)的方法推廣到了劉維爾能隙的求解中。
3.5 量子態(tài)層析
量子態(tài)層析(quantum tomography)是通過(guò)對(duì)很多份相同量子態(tài)的測(cè)量來(lái)估計(jì)一個(gè)未知的量子態(tài)[15]。它是校準(zhǔn)量子系統(tǒng),檢驗(yàn)量子操作的重要技術(shù)。同樣的,由于希爾伯特空間維度隨系統(tǒng)規(guī)模指數(shù)增大,多體系統(tǒng)的量子態(tài)層析也變得極為困難。以谷歌公司2019年實(shí)現(xiàn)量子優(yōu)勢(shì)的實(shí)驗(yàn)為例[40],其量子線路涉及53個(gè)量子比特,對(duì)如此大規(guī)模的量子態(tài)層析最直接的方法需要確定 253 ≈1016個(gè)參數(shù),即使是存儲(chǔ)這些參數(shù)也至少需要 105 TB 的存儲(chǔ)空間,遠(yuǎn)大于當(dāng)前世界上最先進(jìn)的超級(jí)計(jì)算機(jī)的內(nèi)存空間。
神經(jīng)網(wǎng)絡(luò)可以有效表示部分量子態(tài),其所需參數(shù)個(gè)數(shù)只隨系統(tǒng)規(guī)模多項(xiàng)式增加。因此,通過(guò)神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行量子態(tài)層析只需要確定多項(xiàng)式規(guī)模的參數(shù),可極大地減少所需資源。事實(shí)上,神經(jīng)網(wǎng)絡(luò)量子態(tài)層析已經(jīng)被多篇論文提出[30,41],并得到了較多關(guān)注。最近,部分相關(guān)的理論方案也在實(shí)驗(yàn)上得到了驗(yàn)證[42]。
04 展 望
神經(jīng)網(wǎng)絡(luò)量子態(tài)是最近幾年蓬勃發(fā)展的交叉前沿方向。當(dāng)前,這個(gè)方向的研究已經(jīng)取得了一些令人興奮的成果。然而,總體來(lái)說(shuō)其發(fā)展還處于初級(jí)階段,很多重要基本問(wèn)題亟待解決。首先,神經(jīng)網(wǎng)絡(luò)表達(dá)量子態(tài)為何有效及其局限性并未被完全理解。給定一個(gè)量子態(tài),我們無(wú)法有效判斷它是否可以用某個(gè)神經(jīng)網(wǎng)絡(luò)有效表達(dá)。這與矩陣直積態(tài)或更廣的張量網(wǎng)絡(luò)態(tài)在早期的發(fā)展相似。由于量子信息領(lǐng)域的飛速發(fā)展,現(xiàn)在我們知道量子糾纏是張量網(wǎng)絡(luò)有效表示量子態(tài)的關(guān)鍵,也是判斷具體問(wèn)題能否用相關(guān)算法有效解決的前提。然而,量子糾纏并不是神經(jīng)網(wǎng)絡(luò)表達(dá)量子態(tài)的核心要素,理解神經(jīng)網(wǎng)絡(luò)有效性及局限性可能需要發(fā)展新的物理概念與數(shù)學(xué)工具。其次,神經(jīng)網(wǎng)絡(luò)量子態(tài)的“殺手級(jí)應(yīng)用”還未發(fā)現(xiàn)。當(dāng)前已有的研究大多數(shù)還處在原理演示階段。人們發(fā)現(xiàn)了很多問(wèn)題可以用神經(jīng)網(wǎng)絡(luò)解決,但這些問(wèn)題大多數(shù)也可以用傳統(tǒng)方法處理,神經(jīng)網(wǎng)絡(luò)并不是唯一解決途徑。再次,如何利用神經(jīng)網(wǎng)絡(luò)方法有效解決強(qiáng)阻挫量子磁性系統(tǒng)或強(qiáng)相互作用費(fèi)米子系統(tǒng)相關(guān)問(wèn)題仍是未解之謎。這些問(wèn)題是量子多體物理中極為重要,卻最具挑戰(zhàn)性的問(wèn)題。
總之,神經(jīng)網(wǎng)絡(luò)量子態(tài)在機(jī)器學(xué)習(xí)與量子物理之間架設(shè)了新的橋梁。這個(gè)方向的研究有利于不同學(xué)科之間的交叉融通,對(duì)機(jī)器學(xué)習(xí)與量子物理的發(fā)展都大有裨益。當(dāng)前,這個(gè)方向正在蓬勃發(fā)展,挑戰(zhàn)與機(jī)遇并存。鑒于AlphaGo與AlphaFold的成功,我們有理由期待未來(lái)神經(jīng)網(wǎng)絡(luò)量子態(tài)在解決復(fù)雜的量子多體問(wèn)題中取得重要突破,大放異彩。
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)量子態(tài)及其應(yīng)用
文章出處:【微信公眾號(hào):中科院長(zhǎng)春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100713 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238247 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8406瀏覽量
132561
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)量子態(tài)及其應(yīng)用
文章出處:【微信號(hào):cas-ciomp,微信公眾號(hào):中科院長(zhǎng)春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論