“莊周夢胡蝶,胡蝶為莊周?!笨v觀東西方歷史,人類對夢境有著不約而同的執(zhí)念。夢境也是神秘學(xué)的重要部分,常常與預(yù)知未來、認識自己等概念聯(lián)系在一起。時至今日,人類一直試圖解開夢境背后的意義,經(jīng)常求助于各種解釋方法,甚至發(fā)展出了許多流派。
的確,夢境提供了對我們潛意識深處的一瞥,揭示了隱藏的欲望、恐懼和情緒,對我們的現(xiàn)實生活也不無影響。隨著大模型等技術(shù)的興起,在GPT store等平臺上,也出現(xiàn)了聲稱能夠通過對話解析夢境的AI助手。
?圖1. 基于大模型的夢境解析網(wǎng)站:https://dreamybot.com
與民間占卜解夢不同,腦科學(xué)與夢境的相關(guān)研究首先關(guān)注的是夢境的內(nèi)容,例如夢里看到的圖像、聽到的聲音,之后才是夢境的意義。其研究對象也并非單個人的自述(軼事),而是一群人敘述的匯總及其中的統(tǒng)計規(guī)律。伴隨技術(shù)進步,研究方法還包括了使用功能性磁共振成像(fMRI)等腦電檢測,依據(jù)客觀記錄而不是主觀描述來解析夢境。本文將從科學(xué)研究現(xiàn)狀到商業(yè)應(yīng)用前景,概述人們在“如何用AI作為工具指導(dǎo)人們更好地理解做夢”這件小事上做出的努力。
基于個人自述的夢境匯總,
男生女生的夢有區(qū)別嗎?
夢境的內(nèi)容可歸因于大腦對白天收集的信息的處理和整合,這便是美國心理學(xué)家卡爾文·霍爾(Calvin Hall)提出的延續(xù)假設(shè)(continuity hypothesis)。當我們睡眠時,我們的大腦通常會從之前的記憶、經(jīng)歷和情感中提取片段并拼貼成一個故事。這些神經(jīng)活動的復(fù)雜相互作用產(chǎn)生了我們在夢中遇到的生動的、有時令人費解的場景和人物。
人的大腦就像一個專長蒙太奇的導(dǎo)演,它采用日常經(jīng)歷中看似無關(guān)的事件、人物和物體,并以只有潛意識才能理解的方式將它們組合在一起。在夢里,物理和邏輯定律被扭曲,產(chǎn)生了脫離現(xiàn)實引力的奇幻景象和意識流情節(jié),讓我們常常在第二天醒來后反復(fù)琢磨前一晚夢境的深意。
然而科學(xué)研究畢竟不是奇聞怪談的收集,不論哪個學(xué)科,科研的第一步是建立基線,也就是理解大多數(shù)人的典型狀況,以便在后續(xù)嘗試理解個案時,能夠有一個合適的錨點。2020年的一篇發(fā)表在皇家協(xié)會開放科學(xué)(Royal Society Open Science)的期刊上的研究[1],通過自然語言處理,分析了不同年齡和性別的24000個被試自述的夢境,構(gòu)建了數(shù)據(jù)庫Dream Bank。研究發(fā)現(xiàn),年齡,性別,過往經(jīng)歷(如是否當過兵)等不同因素都會對被試者的夢境產(chǎn)生影響(圖2)。該研究基于是美國收集的數(shù)據(jù),由于各國文化風(fēng)俗上的差異,該研究的結(jié)論不適用于國內(nèi),但其研究思路是可以借鑒的。
?圖源:參考文獻[1]
不同年齡的夢境報告中攻擊性的等級從20世紀60年代到現(xiàn)在在逐步減少,這個趨勢和美國的暴力犯罪統(tǒng)計數(shù)據(jù)相符。
除了統(tǒng)計性的群體描述,這類研究還讓人們可以比較和自己處境相似的人會做什么樣的夢。例如在dreamcatcher中,人們可以根據(jù)自身身份查看下圖中的每一個葉子(點擊后對應(yīng)一個夢的描述),通過了解與自身處境相似的人做了什么夢,從而緩解因夢境引發(fā)的焦慮,也可以上傳自身的夢境描述,豐富數(shù)據(jù)庫的內(nèi)容。
?圖3.基于自然語言處理的夢境解析和匯總網(wǎng)站
基于Dream Bank數(shù)據(jù)庫的衍生研究[2],還包括通過GPT模型分析夢境自述文本的困惑度(Preplexity,一個衡量文本意外程度的統(tǒng)計量)。以維基百科的文本作為基線,研究表明夢境中的文本并非人們之前預(yù)計的那樣格外不可預(yù)測,兩者困惑度接近。該研究的另一個發(fā)現(xiàn)也符合常識,即女性對夢的描述文本困惑度更高,組間差異更大,這意味著相比女性,男性的夢更容易預(yù)測。
?圖4.男性和女性夢境自述文本的困惑度對比,圖源:參考文獻[2]
科學(xué)家是如何讀心的?
與上述依賴主觀自述的研究不同,夢境可視化試圖將人腦在潛意識或無意識狀態(tài)下的內(nèi)在認知活動轉(zhuǎn)化為顯性的圖像或標簽,例如做夢時看到了什么,聽到了什么,有什么樣的情感。這其中的研究,包括研究者要一次次的將被試從睡眠時喚醒,詢問夢到了什么的實驗,用以考察人們清醒后對夢的回憶。在這之中,又以清醒夢最為熱門。所謂的“清醒夢”,可看成夢境與清醒的疊加態(tài):做夢者有“正在做夢”的意識,并能描述出自己在做的夢。
夢境可視化的基礎(chǔ),首先是需要證明經(jīng)由核磁共振成像,近紅外線光譜儀及腦電圖(EEG)等方法測量得到的大腦的血流,腦電及因工作而發(fā)熱的變化模式,可被用以預(yù)測腦中的所思所想。19年的研究[3]根據(jù)人腦活動,復(fù)現(xiàn)了被試觀察的影像。而23年的研究[4],基于Stable Diffusion,能夠更準確地再現(xiàn)被試者腦中所看的畫面。
對比圖5和圖6,可以顯著的看到重塑的圖像更加準確了,那這性能進步的背后,是有哪些創(chuàng)新促成的?
?圖5.基于腦電MRI記錄,實用深度神經(jīng)網(wǎng)絡(luò)重現(xiàn)被試觀察到的圖像。圖源:參考文獻[3]
?圖6.被試者看到的真實圖片(第一行)和模型重構(gòu)的圖片對比。圖源:參考文獻[4]
對比2019年的研究與2023年的研究,最直觀的區(qū)別在于2023年的研究增加了語義解碼部分。不過在談及這一點之前,先看看23年研究的圖像解碼是怎么做的。在大腦處理圖像的過程中,像經(jīng)過有損壓縮后再放大的圖片一樣進行操作,腦中圖像會先被壓縮成基本的素描形式,保留關(guān)鍵信息,同時形式更簡潔,便于管理。這些壓縮后的信息在大腦中是分布式存儲的,這為科學(xué)家提供了解碼的可能性。通過fMRI技術(shù),科學(xué)家可以記錄大腦活躍的部分,類似于觀察一個擁有數(shù)萬塊硬盤的超級電腦處理特定數(shù)據(jù)時哪些硬盤處于工作狀態(tài),從而建立起一個基本的模型。
在解碼大腦的實際操作中,基于fMRI數(shù)據(jù),研究者首先根據(jù)大腦的信息壓縮和分布式處理特點,構(gòu)建了一個類似簡筆畫的初步圖像。隨后,在擴散過程中,模型會像繪畫時一樣逐步渲染上色,讓圖像逐漸豐富起來。然而,正如繪畫時需要明確所畫目標,重構(gòu)大腦中想象的圖像也需要利用大腦在觀看圖像后產(chǎn)生的語義信息,即大腦對圖像的描述。
?圖7.研究5的模型框架示意圖。圖源:參考文獻[4]
根據(jù)大腦的“語義地圖”[5],被試在聽到某些詞匯時,相關(guān)的fMRI數(shù)據(jù)顯示這些詞匯在大腦周圍分布,而沒有一個明確的語言處理區(qū)域。與此同時,與意義相關(guān)的詞匯在大腦中的分布更為集中。而研究[4],則將語義信號和視覺信號分別用不同的神經(jīng)網(wǎng)絡(luò)去處理,從而用解碼的語義信息來幫助圖像重建。
例如,當被試者看到的是一個狗的圖畫,但只基于視覺信號,重建的圖像可能會缺少狗的典型特征,使得重建圖像看起來更像是貓;而有了語義信息的幫助,解碼系統(tǒng)發(fā)現(xiàn)觀察到的詞匯和骨頭接近,于是在潛在擴散過程豐富簡筆畫的時候,就會選擇突出那些狗的特征。這種結(jié)合了兩種模型的圖像重建方法,比單一依賴語義或視覺信息的方法,能夠?qū)崿F(xiàn)更清晰、更準確的圖像還原。
?圖8. 由985個詞構(gòu)成的大腦語義地圖。圖源:參考文獻[5]
?圖9. 圖源:參考文獻[4]
對比被試看到的原圖,以及只基于圖像特征(第二列),只基于語義特征(第三列)以及基于兩者(第四列)的效果圖。
近年來,科學(xué)家通過類似的思路,可以基于腦電數(shù)據(jù)生成被試聽到的聲音信號[6],從而讓失語者可以說出自己腦中所想的話。此外,當前還有研究能通過腦電信號解讀出被試者默念的文本[7],并重建被試觀看的短視頻內(nèi)的場景[8]。所有這些研究,都說明了研究者目前有能力根據(jù)大腦活動讀心。
但這距離解夢還有很長的距離。原因首先是夢境大多是迷幻的,跳躍的,人們會懷疑對夢境的描述更加沒有邏輯,充滿了離奇的意外(前述的基于夢境描述文本困惑度的[2],已提供了相反的證據(jù));第二個原因,則在于很多夢境中包含了強烈的情緒,人們會擔(dān)心夢境中強烈的情緒可能干擾其解讀。
對此,24年的一項研究[9]聲稱可以結(jié)合個人敘事和fMRI,以此開發(fā)預(yù)測自發(fā)思維情感內(nèi)容的模型,從而判斷清醒夢中的主觀體驗是積極還是消極的。該預(yù)測模型不僅在閱讀故事時能夠預(yù)測被試的自我相關(guān)性和情感體驗,同樣適用于在自發(fā)思維(清醒夢)或休息狀態(tài)下的199名參與者。
在這一研究中,研究人員監(jiān)測參與者閱讀故事時大腦活動,旨在解碼思維的情感維度。為了捕捉各種思維模式,參與者參與了一對一訪談,以制作反映他們過去經(jīng)歷和情感的個性化敘事刺激。當參與者閱讀他們的故事時,其大腦活動在MRI掃描儀內(nèi)被記錄。在fMRI掃描后,參與者再次閱讀故事,并報告每個時刻感知到的自我相關(guān)性(即這些內(nèi)容與他們的相關(guān)程度)和情感(即這些內(nèi)容是積極還是消極)。使用每個參與者的自我相關(guān)性和情感評分的五分位數(shù),研究團隊創(chuàng)建了25個不同的情感和自我相關(guān)性組合,使用機器學(xué)習(xí)技術(shù)結(jié)合這些數(shù)據(jù)及49名參與者的fMRI數(shù)據(jù)來實時解碼思維的情感維度。
研究發(fā)現(xiàn)前扣帶回皮層和島葉前部等關(guān)鍵大腦區(qū)域在預(yù)測個人相關(guān)性和情感調(diào)子方面至關(guān)重要。通過解碼與具體情節(jié)無關(guān)的情感,該研究有助于我們理解影響主觀體驗的內(nèi)部狀態(tài)和背景,可能有助于揭示思維和情感方面的個體差異,并有助于評估心理健康。
夢境可視化的現(xiàn)實與理想
前述的研究都還沒有直接涉及對做夢時大腦的解析,只是試圖對清醒狀態(tài)(或清醒夢)下受試者的所思所見進行預(yù)測。然而,有研究開始直接探索夢境中大腦的活動,并嘗試將夢中的圖像可視化。
例如,研究[10]依據(jù)兩名受試者在fMRI下的大腦活動數(shù)據(jù)和他們自述的夢境內(nèi)容,揭示了大腦在夢境中的圖像處理具有層次化特點,即做夢時會激活與夢到物體相關(guān)的分層視覺特征表征。研究表明,從自做夢時大腦活動中解碼的特征值與夢中物體類別相關(guān)的特征值,在在中間到高級深度神經(jīng)網(wǎng)絡(luò)中表現(xiàn)出正相關(guān)。這不僅提高了區(qū)分夢中物體類別的準確性,而且表明夢境中的視覺特征表征與清醒時的視覺處理相似,意味著大腦在做夢時可能和清醒時使用相同的機制,這支持了通用解碼方法在不同視覺體驗(清醒和夢境)中的泛化能力,從而論證了夢境解析的可行性。
?圖10.圖源:參考文獻[10]
單次實驗中,針對夢境在出現(xiàn)圖片的預(yù)測,可基于較高抽象層級的特征得出。
早在2013年,研究[11]在視覺皮層區(qū)域刺激誘導(dǎo)的腦活動上訓(xùn)練的解碼模型,顯示出模型對夢境內(nèi)容的分類能力超過隨機猜測。在這項研究中,三名受試者在進行磁共振睡眠實驗時,每當腦電信號被檢測到,他們便被喚醒,并描述醒來前的視覺體驗。為了收集充分的數(shù)據(jù),每位受試者平均每5-6分鐘就被喚醒一次,主要關(guān)注人們剛?cè)胨A段產(chǎn)生的類夢境視覺感受。在超過75%的喚醒中,受試者報告了夢中的內(nèi)容。預(yù)測模型試圖區(qū)分受試者夢見的是人還是椅子等物體,并在解碼器的輸出中使用了多個標簽來提升準確性。這距離上文所講的解碼夢境中的所思所想,還相距甚遠。
21年來自清華大學(xué)未來實驗室的研究[12],基于11名被試者REM睡眠期的EEG數(shù)據(jù),結(jié)合心理問卷幫助評估情緒,最終生成了夢境的抽象視覺表述。圖11展示了基于EEG產(chǎn)生的對夢境的藝術(shù)化展示,該例中夢境的情感關(guān)鍵詞是如釋重負(relieved)。這項研究進一步說明了當前對夢境的解讀,還遠遠做不到“像素級”的準確度,只是能夠?qū)η楦羞M行定性的含糊描述,或者對夢境中出現(xiàn)的物體生成有一個比隨機更準確的有根據(jù)猜測。
?圖11.基于EEG數(shù)據(jù)對夢境中的情感產(chǎn)生的藝術(shù)化表征。圖源:參考文獻[12]
然而,前文關(guān)于清醒時大腦解析的研究,以及夢境和大腦遵循相同神經(jīng)機制的研究,共同說明了夢境解析具有技術(shù)可行性,只是目前受限于當前研究條件(例如fMRI的機器噪音,實驗成本,受試者過少等技術(shù)因素)還不夠成熟。未來隨著技術(shù)的進步,有著巨大的潛力。且夢境可視化這項技術(shù)在心理健康領(lǐng)域的應(yīng)用具有重要意義。對夢境的理解可能帶來新的治療方法,特別是創(chuàng)傷后應(yīng)激障礙(PTSD)、抑郁癥和焦慮癥等疾病。
除了心理干預(yù),對夢境的重現(xiàn)還可以用于創(chuàng)意生成。應(yīng)用創(chuàng)意設(shè)計等方式對夢境中的內(nèi)容進行重構(gòu),可以產(chǎn)生更有藝術(shù)創(chuàng)造力的內(nèi)容。此外,在科學(xué)史中,凱庫勒在夢中找到了苯環(huán)的結(jié)構(gòu),門捷列夫在夢中產(chǎn)生了元素周期表的概念,我們不知道有多少科學(xué)上的創(chuàng)意,出現(xiàn)又無聲的消失在夢中,通過對夢境的記錄和解讀,我們未來也許能夠撿起更多這樣帶有科學(xué)創(chuàng)新點的夢。
總的來說,EEG和fMRI已經(jīng)將夢境分析從純粹的猜測轉(zhuǎn)變?yōu)閷嵶C科學(xué)探索,從而得以讓我們更加接近揭示夢境的真相的那一天。
夢境解析和引導(dǎo)的商業(yè)應(yīng)用
說起解夢,人們最熟悉的是弗洛伊德-榮格的精神分析學(xué)派。雖然這一派的理論廣為人知,但學(xué)術(shù)界對其有效性存在爭議。隨著大模型及對應(yīng)智能體的成熟,市面上出現(xiàn)了不少號稱可以解夢的聊天機器人,但這樣的機器人帶給筆者的個人體驗并沒有多么驚艷。更有一些解夢的應(yīng)用,宣稱結(jié)合中醫(yī)典籍,對于這樣有“偽科學(xué)”嫌疑的研究,讀者更應(yīng)該批判性地審視,不能因為大模型的套皮而輕信。
除了就夢境內(nèi)容展開對話,基于夢境和AI結(jié)合還可以考慮夢境記錄方面的應(yīng)用??紤]到我們對夢境的記錄往往出現(xiàn)在剛睡醒或半睡半醒間,并且很大比例的夢境會在我們醒來后消失,一個記錄工具顯得尤為重要。蘋果平臺的PlotPilot[13]可記錄使用者對夢境的語音描述,并通過AI文本分析配上屬于對應(yīng)的背景音樂,制作成專屬的有聲書(現(xiàn)在可以根據(jù)夢境描述產(chǎn)生視頻)。這樣的工具不僅能幫助用戶更好地了解自身潛意識的心理需求,還可以促進對夢境的研究。
如果說根據(jù)腦電活動預(yù)測個人的所思所想,會讓人想到許多科幻小說里的場景,那么能幫助用戶進入且穩(wěn)定在清醒夢中的工具,則充滿了《盜夢空間》的意味。2024年1月,美國初創(chuàng)公司“Prophetic”開發(fā)了一款名為“Morpheus-1”的新型人工智能模型,該模型可以以大腦的腦電活動作為提示詞,基于多模態(tài)大模型生成與該大腦狀態(tài)相互作用的形狀聲波。據(jù)稱,輸出的聲波可與Prophetic計劃明年春季發(fā)布的一款新頭帶產(chǎn)品“The Halo”綁定。The Halo會發(fā)送聲波進入大腦,與當前的大腦狀態(tài)相連接,從而使心靈進入清醒狀態(tài)。據(jù)Prophetic稱:“引導(dǎo)產(chǎn)生的清醒夢是一種夢者意識到自己正在睡覺的夢?!倍驹O(shè)想的產(chǎn)品則可以讓用戶有效控制自己的夢境。
由于該公司成立不久,宣傳的產(chǎn)品還沒有發(fā)布,其技術(shù)的實際能力還有待進一步觀察。一旦成功,此舉對學(xué)界和市場都有重要的意義,引導(dǎo)清醒夢將有助于減少PTSD等心理疾病引發(fā)的噩夢,促進正念,為意識的神秘本質(zhì)打開新的窗口。
另一方面,無論是引導(dǎo)還是預(yù)測夢境,這些涉及個人私人體驗的應(yīng)用無疑將產(chǎn)生大量敏感的數(shù)據(jù)。如何避免這樣的技術(shù)被濫用?消費者需要提前意識到技術(shù)的雙刃劍性質(zhì),有保護自身的權(quán)利和隱私的意識。在技術(shù)成熟前,不妨先通過科幻小說進行思想實驗,模擬各種情況下新技術(shù)產(chǎn)品的推動可能對社會造成的影響:例如,如果未來的打工人要通過清醒夢來證明自己對企業(yè)的忠誠,多疑的伴侶可以偷偷記錄并解析枕邊人的夢境以查找出軌的證據(jù)時,社會又將成為什么樣?
小結(jié)
“Life is but a dream···”
從弗洛伊德和榮格的心理學(xué),到最新的基于腦電的讀心術(shù),以及基于大模型的海量夢境自述的文本分析,我們對大腦的理解,正在從定性轉(zhuǎn)為定量,從個體案例轉(zhuǎn)為群體統(tǒng)計,從依賴主觀描述轉(zhuǎn)為客觀數(shù)據(jù)。隨著對夢境產(chǎn)生機制的了解,人們也能夠逐漸去控制夢的產(chǎn)生,從而避免或減少噩夢的出現(xiàn),甚至引導(dǎo)清醒夢的產(chǎn)生。
同時,隨著人們對夢境的測量和控制手段的進步,研究者得以用科學(xué)地方式去嘗試回答更多之前無法解答的問題,如夢境中的情感體驗究竟是什么樣的?動物們在做夢時在想到了什么場景?AI是否具有做夢的能力?知識帶來新的技術(shù)應(yīng)用,而新技術(shù)擴展了可觸及知識的邊界。對夢境的研究,一旦脫離了民科和偽科學(xué),就將踏上科學(xué)界通用的正向飛輪。