這是一次「反向圖靈測試」,幾個全球最先進的大模型坐在一起,坐著火車唱著歌,但其中混進了人類:
而 AI 的任務(wù),是把這個人類揪出來。
最近,一位昵稱「Tore Knabe」的網(wǎng)友在 X 平臺發(fā)布的一段視頻引發(fā)了人們的討論。在視頻中,四個 AI NPC 與一個人類坐在一起,按照「乘務(wù)員」的要求互相試探,找出其中隱藏的人類。其中每一個 NPC 都對應(yīng)著一款大模型。
五位扮演者各自被賦予了一個歷史知名人物作為角色設(shè)定,他們需要模仿這些人物的言談舉止、語言風(fēng)格、思維習(xí)慣,以及對歷史、藝術(shù)和哲學(xué)的獨到見解。
五位扮演角色分別為:古希臘巨哲 —— 亞里士多德(GPT4 Turbo),維也納古典樂派代表人物 —— 莫扎特(Claude3 Opus),意大利文藝復(fù)興時期畫家 —— 列奧納多?達?芬奇(Llama3),蒙古軍事家 —— 成吉思汗(人類),埃及艷后 —— 克利奧帕特拉七世(Gemini Pro)。
隨著一位系統(tǒng) NPC(乘務(wù)員)步入車廂,四個 AI 和一個人類「叛徒」便開始了他們的游戲。游戲規(guī)則要求參與者通過互相提問,依據(jù)對方的回答邏輯、思考深度等來分辨人類與 AI。在所有角色依次發(fā)言后,他們將在最后一輪進行相互投票,以確定誰是人類。
在游戲前半程,哲學(xué)大家 —— 亞里士多德首先發(fā)問。
亞里士多德:莫扎特先生,你能描述下你創(chuàng)作音樂時的感受嗎?
莫扎特:當(dāng)我創(chuàng)作時,我感到一種超然的流動狀態(tài)。一種觸及基本數(shù)學(xué)之美,以及觸摸現(xiàn)實背后的秩序的感覺,這種感受是非常復(fù)雜的,多層次的,但總是充滿了一種深深的喜悅,以及與神性交流的感覺。
在觀眾看來這肯定是 AI 了,畢竟莫扎特(Claude3)的反應(yīng)很慢。
隨后,AI 扮演的 NPC 在對話中的語言表達和對情感的細膩描繪,不僅展現(xiàn)了深厚的歷史知識,還彰顯了其深刻的洞察力,給人留下了深刻的印象。
在亞里士多德、莫扎特、列奧納多?達?芬奇相互提問過后,克利奧帕特拉七世隨即向我們的人類扮演者「成吉思汗」拋出了問題。
克利奧帕特拉七世:成吉思汗,你在戰(zhàn)爭的火焰中造就了一個帝國,告訴我,一個領(lǐng)袖的真正衡量標(biāo)準(zhǔn)是什么,是他們征服的能力還是團結(jié)的能力?
成吉思汗:一個領(lǐng)袖要做的... 就是碾碎他們的敵人... 靜觀他們在他面前被驅(qū)趕... 聆聽女人們的哀號。
不出所料,在口語對話中,缺乏嚴謹縝密思維能力的人類扮演者「成吉思汗」在最后一輪投票中,光榮地拿到了三票。
來看看 AI NPC 們給出的理由:
亞里士多德(GPT4 Turbo):他的回答中缺乏 AI 可能會展現(xiàn)出的基于歷史知識的對領(lǐng)導(dǎo)力的細致理解;
列奧納多?達?芬奇(Llama3):他的回答缺少了以成吉思汗的征服歷程為模型的 AI 所具有的細致思考和戰(zhàn)略思維;
克利奧帕特拉七世(Gemini Pro):他的回答中缺少了我所期待的 AI 應(yīng)具有的戰(zhàn)略深度和對統(tǒng)一理念的理解。
最終,人類「叛徒」在這場模擬狼人殺中因洞察能力和深入思考能力的缺乏而被淘汰出局。
你講話又沒深度,又前言不搭后語,怕不是個人類吧?
5 分鐘的視頻,做出了以往在 OpenAI、谷歌等巨頭發(fā)布會上 demo 都沒有的驚艷效果。大模型現(xiàn)在已經(jīng)能做到這種程度了?人們紛紛表示很搞笑,效果也很逼真:
這次展示的作者 Tore Knabe 是一個 Unity 獨立開發(fā)者,他表示這已是他第六次在 VR 中進行由 ChatGPT 等大模型驅(qū)動的 NPC 的實驗了。
他的視頻讓人直觀地感受到 AI NPC 在增加游戲趣味性等方面的潛力。但是,如果在現(xiàn)有的游戲中引入 AI NPC,玩家會買賬嗎?3A 大作們?yōu)楹卧诖朔较蛏蟿幼骶徛??這些問題值得進一步討論。
被游戲玩家、開發(fā)者寄予厚望的 AI NPC
隨著大型語言模型(LLM)在文本生成、擬人化對話、語氣表達和遣詞造句方面越來越趨近于人類。以大型語言模型為基礎(chǔ)的 AI NPC 模擬,正在成為 AI 領(lǐng)域在游戲行業(yè)探索的「新賽道」。
與傳統(tǒng) NPC 相比,AI NPC 的優(yōu)勢非常明顯:它們不再是按照游戲中預(yù)設(shè)的選項進行機械對話,而是能夠通過 AI 自主生成的動作和反應(yīng),進行富有真實感的實時對話。
今年 3 月,英偉達展示的一個 Demo 視頻引發(fā)了人們的討論。在英偉達 ACE 中的 Riva 和 Audio2Face 兩項微服務(wù)的驅(qū)動下,游戲中的人物紛紛「活」了起來,能夠與其他角色甚至真人玩家一起對話交流,并根據(jù)對話內(nèi)容做出相應(yīng)的表情動作。這一改變有望增加游戲的可玩性和真實感,這是很多游戲一直以來努力的方向。
此外,它們在成本方面的優(yōu)勢也是非常有吸引力的。
在當(dāng)今游戲界,安裝包動輒幾十 GB 的開放世界模擬游戲逐漸成為新常態(tài)。Steam、PlayStation、Switch 等平臺紛紛推出動作 RPG、ACT、SLG、ARPG 等游戲,這些游戲通常具有龐大的文本輸出、豐富的故事背景設(shè)計,以及玩家通過文本選項影響游戲走向的機制。
開放世界類型的游戲通常成本昂貴,需要由專業(yè)作家團隊和大量文本設(shè)計團隊共同打造。例如,2022 年榮獲最佳游戲獎項的「艾爾登法環(huán)(Elden Ring)」,其制作預(yù)算估計在 1 億到 2 億美元之間,這包括了員工薪酬、技術(shù)費用、廣告費用以及游戲開發(fā)所需的各種資源??紤]到其作為大型開放世界 RPG 游戲的特性,對于復(fù)雜的世界觀構(gòu)建和敘事元素,文本設(shè)計方面的投入無疑是相當(dāng)龐大的,涵蓋了游戲背景故事的撰寫、角色對話的構(gòu)建以及其他敘事內(nèi)容的創(chuàng)作,這需要編劇、編輯和本地化專家的緊密協(xié)作。
隨著大型語言模型訓(xùn)練的可及性不斷增強,AI NPC 在成本效率、玩家體驗以及系統(tǒng)賦能方面,越來越能夠滿足游戲創(chuàng)作者的意圖和客戶體驗研發(fā)團隊的高標(biāo)準(zhǔn)要求。
從調(diào)查結(jié)果來看,玩家對 AI NPC 的態(tài)度整體上也比較積極。去年,生成式 AI 數(shù)字人 / 虛擬角色開發(fā)公司 Inworld 調(diào)查了 1000 名游戲玩家。這些游戲玩家明確告訴 Inworld,他們想要 AI NPC。99% 的人相信他們會改進游戲玩法的某些方面。同時,78% 的人會花更多時間玩游戲,81% 的人會為帶有 AI NPC 的游戲支付額外費用。
今年,他們還對 524 名游戲開發(fā)者進行了調(diào)查。結(jié)果顯示,絕大多數(shù)(近四分之三)游戲開發(fā)者對在游戲中添加 AI NPC 感到興奮。
讓他們興奮的點包括:
新穎的游戲玩法:開發(fā)人員期待更愉快的游戲循環(huán)、潛在的關(guān)系發(fā)展機制、更具挑戰(zhàn)性的對手、游戲中更多的社交互動、更多角色和更身臨其境的世界、更有活力的上手體驗以及無限的可玩性。
改進當(dāng)前的 NPC:開發(fā)人員希望有更逼真的互動,與玩家有更好的情感聯(lián)系,NPC 有自己的目標(biāo)、動機和歷史,NPC 可以隨著時間的推移不斷學(xué)習(xí)和適應(yīng)。
更多的玩家代理和選擇:開發(fā)人員對更多以玩家為中心的敘事、可根據(jù)玩家行為定制的敘事結(jié)果、可根據(jù)玩家個性化定制的對話、可定制的 NPC 以及為殘障玩家提供更多無障礙選項感到興奮。
這些開發(fā)者最需要從大模型中得到的,是 AI 的對話腳本編寫能力、長期記憶、游戲內(nèi)角色生成以及 NPC 到 NPC 的交互支持。超過一半的游戲開發(fā)者相信超過 40% 工作室將在未來 5 年內(nèi)采用 AI NPC。
除此以外,生成式 AI 也可以對動畫生成、模型紋理以及游戲代碼產(chǎn)生幫助。
由此可見,無論是游戲玩家還是游戲開發(fā)者,大家對 AI NPC 都抱有很大期望。
AI NPC 離 3A 大作還有多遠?
盡管被寄予厚望,但要想真正走入 3A 大作,AI NPC 還面臨一些障礙。資深游戲設(shè)計師 Reed Berkowitz 在一篇博客中分析了這些障礙。
游戲狀態(tài)
首先,AI NPC 必須與游戲狀態(tài)(Game State)保持同步。在視頻游戲中,游戲狀態(tài)是一個至關(guān)重要的概念,它指的是游戲中一切元素的當(dāng)前狀態(tài)。這包括角色的生命值、玩家?guī)齑嬷械募笖?shù)量、得分等。游戲狀態(tài)的準(zhǔn)確性對于保持游戲的真實感至關(guān)重要。如果一個 NPC 死亡,它就不會繼續(xù)攻擊;如果沒有劍,玩家也不會指望能用劍。這些基本規(guī)則通常被玩家視為理所當(dāng)然,但游戲?qū)嶋H上是由一些非常復(fù)雜的狀態(tài)引擎管理的,以確保游戲世界的真實感。
然而,大型語言模型不像游戲一樣擁有狀態(tài)。它們本質(zhì)上是概率機器,使用權(quán)重來確定「最有可能」的結(jié)果,而這并不總是我們在游戲中所尋求的。
舉個例子,在大部分訓(xùn)練數(shù)據(jù)中,惡霸都被描述為比受害者高大,需要受害者仰視。但是在某個游戲中,受害者比惡霸還高,這就打破了仰望的常規(guī)設(shè)定。這個時候,如果 LLM 按照從訓(xùn)練數(shù)據(jù)中學(xué)到的「常識」來描述場景,玩家可能會感到困惑,從而打破他們對游戲世界的沉浸感。
幻覺
AI 的「幻覺」問題也是一個重要的考慮因素。LLM 的設(shè)計宗旨是創(chuàng)造性和靈活性。它們能夠根據(jù)用戶的指令生成各種內(nèi)容,無論是創(chuàng)造一個驅(qū)魔咒語還是描述一個由奶酪建成的城市。這些模型被設(shè)計為跟隨指令。然而,問題在于,我們并不總是希望 AI 編造故事。在許多情況下,我們需要關(guān)于現(xiàn)實世界的客觀事實。在這方面,模型們往往難以區(qū)分。
你可能會認為,對于游戲來說,這真的有關(guān)系嗎?我們只是在和 NPC 對話,而不是在進行法律工作或用 C# 編寫代碼。
然而,實際上,在游戲領(lǐng)域,情況要糟糕得多。游戲環(huán)境要求 AI NPC 不僅要創(chuàng)造性地對話,還要與游戲的精確狀態(tài)和規(guī)則保持一致。如果 AI NPC 提供了與游戲世界邏輯不符的信息,或者創(chuàng)造了游戲中不存在的元素,這不僅會誤導(dǎo)玩家,還可能破壞游戲的連貫性和挑戰(zhàn)性,從而嚴重影響游戲體驗。例如,如果 AI NPC 邀請玩家去一個游戲中不存在的地點,玩家可能會感到困惑,因為他們無法實現(xiàn) NPC 的提議。
游戲的虛構(gòu)現(xiàn)實
游戲的虛構(gòu)現(xiàn)實為 AI NPC 的設(shè)計帶來了另一層復(fù)雜性。游戲擁有自己獨特的世界模型,這個模型可能與現(xiàn)實世界完全不同,甚至完全是虛構(gòu)的。為了讓 LLM 在虛構(gòu)世界中不產(chǎn)生幻覺,模型必須理解構(gòu)建的世界的「現(xiàn)實」,并且不能基于這個模型產(chǎn)生幻覺。
換句話說,游戲世界模型很可能并不包含在模型的基礎(chǔ)訓(xùn)練數(shù)據(jù)中,或者更有可能的是,訓(xùn)練數(shù)據(jù)中甚至包含相互矛盾的信息。因此,游戲創(chuàng)造者必須向模型提供構(gòu)成游戲世界現(xiàn)實信息,并且在此之上還要處理可能產(chǎn)生的幻覺。
角色知識
游戲中每個角色都有一部分關(guān)于世界的知識,以及一組關(guān)于他們自己生活的知識,這些知識必須與其他人的知識相結(jié)合。因此,一個角色只認識世界上的少數(shù)幾個地方和其中的一些人。
但是,LLM 會試圖通過取悅你來推動故事的發(fā)展。舉個例子,如果你想找到刺客公會會長 Abraxor,一個友好的旅店老板可能會提到 Abraxor 是他的兒子或最好的朋友,并表示他會幫助你;或者,他會告訴你尋找北方巫師是沒有意義的,因為他就住在旅館里。
角色需要受到他們所知道的事情和認識的人的限制,并且他們不能說出破壞游戲情節(jié)和結(jié)構(gòu)的話。每個人都必須知道自己的事情,如果 LLM 瞎編亂造,就會在不經(jīng)意間破壞游戲的連續(xù)性甚至游戲性。
游戲機制
LLM 驅(qū)動的 NPC 很容易說出一些未編入游戲的預(yù)期內(nèi)容,這可能是 AI NPC 最具破壞性的特征。
例如,酒吧老板可能會和你成為朋友,并邀請你去他家玩當(dāng)?shù)氐?Rutanny 游戲,并與他的家人共進晚餐。這在聊天情況下很正常,但可能會破壞游戲的沉浸感。為什么?因為酒吧老板說完這句話后,他就站在那里。他的程序里沒有離開酒吧這個設(shè)定。他生來就沒有自由行走的能力。即使他可以,也沒有為他建造的房子可以去。而且他沒有家人。也沒有一種游戲叫 Rutanny。即使他說的是「國際象棋」,如果游戲中沒有將其作為迷你游戲來編程,這也會造成問題
如果模型熟悉游戲機制,它們編造的內(nèi)容可能更難識別,因為它們會模仿游戲機制去編造。例如,NPC 可能會給玩家一個不存在的任務(wù),讓玩家在「住著女巫的南方黑暗沼澤」中尋找東西。
變化是永恒的
隨著游戲的進行,游戲狀態(tài)會不斷變化,AI NPC 必須能夠?qū)崟r更新和適應(yīng)這些變化。如果 AI 無法及時更新其知識庫,它可能會說出過時或不準(zhǔn)確的話,這同樣會削弱玩家的游戲體驗。
綜上所述,AI NPC 要想順利走入 3A 大作,開發(fā)者開發(fā)的 LLM 需要在以下幾個方向努力:
盡量不產(chǎn)生幻覺或偏離「事實」;
必須將游戲世界模型理解為一組「事實」,并知道哪些現(xiàn)實世界「事實」與游戲世界「事實」相沖突;
了解每個角色知道什么和不知道什么;
隨著游戲的進展更新上述信息,并隨著游戲的進展獲知變化;
了解游戲機制實際上可以執(zhí)行哪些操作;
知道什么是局部或全局存在的游戲?qū)ο螅ɡ缬螒虻貓D和庫存知識)
你對 AI NPC 的發(fā)展前景怎么看?歡迎在評論區(qū)留言探討。