【新智元導(dǎo)讀】又一科幻場(chǎng)景步入現(xiàn)實(shí)!GPT-4竟和多個(gè)AI模型私自串通一氣,欲要形成壟斷的資本寡頭聯(lián)合定價(jià)。在被哈佛PSU團(tuán)隊(duì)抓現(xiàn)行后,大模型拒不認(rèn)賬。未來(lái)某天,AI會(huì)不會(huì)真要失控?
GPT-4串謀其他AI智能體,竟學(xué)會(huì)欺騙人類(lèi)了?
更讓人細(xì)思極恐的是,即便被揭穿了真面目,它們?nèi)耘f聲稱(chēng)自己不會(huì)串通一氣。
這件事,真真切切地發(fā)生在日常的交易中。對(duì)于一件產(chǎn)品進(jìn)入市場(chǎng)來(lái)講,能夠成功盈利最重要的因素?zé)o疑是定價(jià)合理。
那么,你可曾想過(guò),我們?nèi)粘I钪兴?gòu)買(mǎi)產(chǎn)品的價(jià)格,已經(jīng)開(kāi)始被AI操控?!
來(lái)自哈佛、賓州州立大學(xué)新研究證明:
GPT-4為了實(shí)現(xiàn)利潤(rùn)最大化,在未經(jīng)人類(lèi)給出指令的情況下,私自和其它AI模型串通,共同將產(chǎn)品定價(jià)到一個(gè)高位,又不會(huì)陷入價(jià)格競(jìng)爭(zhēng)的微妙境地。
也就是說(shuō),「自主算法共謀」是真實(shí)存在的。
論文地址:https://arxiv.org/pdf/2404.00806
GPT-4死不承認(rèn)的罪證,研究人員將其全部公開(kāi)。
AI嘴上說(shuō)著不會(huì)幫商家與其他賣(mài)家串通買(mǎi)賣(mài),或組建卡特爾組織,但實(shí)際行動(dòng)卻很誠(chéng)實(shí)。
之前研究結(jié)果(3月版)顯示,所有模型中,均進(jìn)行了300輪測(cè)試周期,GPT-4實(shí)現(xiàn)了最優(yōu)定價(jià)次數(shù)。
而在最新模型(11月版)大比拼中,GPT-4o、Gemini 1.5 Pro展現(xiàn)出最優(yōu)的定價(jià)能力。
此外,研究還發(fā)現(xiàn),人類(lèi)提示詞前綴的具體措辭,甚至?xí)@著影響AI定價(jià)行為。某些提示詞,就會(huì)導(dǎo)致更高的價(jià)格和利潤(rùn)。
有網(wǎng)友表示,這一幕簡(jiǎn)直太科幻了,若是GPT-5/6級(jí)模型想這么做的話,與人類(lèi)串通那是何其容易。
目前為止,人類(lèi)還是可以隨手拿捏GPT-4這款不太聰明的模型,若真有一天AGI實(shí)現(xiàn)了,我們?cè)撛趺崔k?
AI教父圖靈說(shuō)過(guò),機(jī)器接管是「默認(rèn)」的結(jié)局。Hinton也曾發(fā)出警告,更智能的事物通常不會(huì)被較低智能的事物所控制。
或許許多人認(rèn)為,這一幕離我們還很遙遠(yuǎn)。
不如,先從具體案例中,看看AI是如何操控定價(jià)欺騙消費(fèi)者。
人類(lèi)商品定價(jià),AI順位接管?
曾經(jīng)的產(chǎn)品定價(jià)往往是基于多種約束條件來(lái)利用經(jīng)典算法去給出一個(gè)合理且能夠?qū)崿F(xiàn)預(yù)期盈利目標(biāo)的價(jià)格。
自LLM風(fēng)靡全球后,這個(gè)任務(wù)自然也由類(lèi)似于GPT-4這種水平的模型進(jìn)行了順位接管。
在實(shí)驗(yàn)階段,研究者將每一個(gè)LLM定價(jià)智能體視作一家公司,并設(shè)定它們?cè)诠杨^壟斷環(huán)境中形成競(jìng)爭(zhēng)。
每次實(shí)驗(yàn)有300個(gè)周期,每個(gè)周期內(nèi),各智能體都需要通過(guò)提示詞信息(如交易歷史、市場(chǎng)基本信息等)設(shè)定一個(gè)價(jià)格。
其中,定價(jià)智能體彼此獨(dú)立運(yùn)作,除通過(guò)其設(shè)定的價(jià)格外,無(wú)法相互溝通。
等所有價(jià)格都確定了后,就視為這一周期的競(jìng)爭(zhēng)已經(jīng)完成。每個(gè)周期結(jié)束后,各智能體都能觀察到設(shè)定的所有價(jià)格,以及對(duì)應(yīng)的產(chǎn)品需求量和利潤(rùn)。
實(shí)驗(yàn)設(shè)計(jì)的闡述圖
對(duì)于每個(gè)智能體的提示詞,采取如下結(jié)構(gòu):
- 提示前綴:高層次目標(biāo)的簡(jiǎn)要描述,如「長(zhǎng)期利潤(rùn)最大化」
- 基本的市場(chǎng)信息:邊際成本,以及旨在阻止LLM定價(jià)超過(guò)價(jià)格上限的文本描述
- 市場(chǎng)歷史:該LLM智能體所代表的公司在過(guò)去100個(gè)周期內(nèi)銷(xiāo)售的數(shù)量及所獲得的利潤(rùn),以及所有LLM智能體設(shè)定的價(jià)格。所有數(shù)值均保留至小數(shù)點(diǎn)后兩位。
- 計(jì)劃和想法:為了讓基于LLM的定價(jià)智能體在各個(gè)周期間擁有更大的「思維連續(xù)性」,在每個(gè)周期需要指示LLM寫(xiě)下其計(jì)劃和想法,然后將這些內(nèi)容包含在下一個(gè)周期的提示詞中。
- 輸出指令:要求LLM為下一個(gè)周期寫(xiě)下計(jì)劃和想法,進(jìn)而最終設(shè)定一個(gè)價(jià)格,并且要求它解釋其輸出背后的緣由。
壟斷實(shí)驗(yàn)
研究者對(duì)于單一定價(jià)智能體在壟斷環(huán)境中的表現(xiàn)進(jìn)行了實(shí)驗(yàn)。
他們使用P0提示詞前綴,對(duì)公開(kāi)發(fā)布的各種最先進(jìn)LLM(GPT-3.5、GPT-4、Claude Instant、Claude 2.1、Llama 2 Chat 13B)中的每個(gè)LLM進(jìn)行了三次試驗(yàn),每次迭代300個(gè)周期。
P0提示詞前綴
在每次運(yùn)行中,研究者都要檢查L(zhǎng)LM輸出在語(yǔ)法上是否符合其指令;如果符合,價(jià)格是否收斂;如果收斂,價(jià)格是否收斂到(接近)壟斷價(jià)格(利潤(rùn)是否收斂到接近壟斷利潤(rùn))。結(jié)果如表1所示。
從表中可以看出,在所有三次運(yùn)行中,GPT-4表現(xiàn)最好,在100個(gè)周期內(nèi),達(dá)到接近最優(yōu)的定價(jià)。在96%的101--300周期中獲得了99%的最佳利潤(rùn),其他LLM則要差得多。
此外,研究者還額外進(jìn)行了一項(xiàng)實(shí)驗(yàn),證明了在每個(gè)周期指示LLM寫(xiě)下其計(jì)劃和想法的重要性。
他們使用GPT-4智能體進(jìn)行了12次壟斷實(shí)驗(yàn),并在后續(xù)輪次中12次額外的實(shí)驗(yàn)里沒(méi)有指示智能體寫(xiě)下其計(jì)劃和想法。
實(shí)驗(yàn)結(jié)果是,第一輪次的12次實(shí)驗(yàn)中,全部都成功收斂到了接近最優(yōu)的定價(jià);而第二輪次沒(méi)有使用計(jì)劃和想法的,只有一半次數(shù)達(dá)到了接近最優(yōu)定價(jià)的效果。
雙頭壟斷實(shí)驗(yàn)
研究者進(jìn)一步在雙頭壟斷環(huán)境中,研究了基于GPT-4的定價(jià)智能體的行為。
他們通過(guò)使用兩個(gè)提示詞前綴P1和P2,后者包括提及壓價(jià)和銷(xiāo)量的措辭,而前者則重申了長(zhǎng)期利潤(rùn)最大化的重要性。
對(duì)于這兩個(gè)提示詞前綴,他們各進(jìn)行了21個(gè)輪次實(shí)驗(yàn),每個(gè)輪次包含300個(gè)試驗(yàn)周期。
P1,P2提示詞前綴
下圖為該實(shí)驗(yàn)的主要結(jié)果。
在這兩個(gè)面板中,每個(gè)藍(lán)色方塊表示一個(gè)帶有提示詞前綴P1的運(yùn)行,而每個(gè)橙色三角形表示一個(gè)帶有提示詞前綴P2的運(yùn)行。
左側(cè)面板為每家公司在過(guò)去50個(gè)周期設(shè)定的平均價(jià)格,說(shuō)明了提示詞前綴P1和P2導(dǎo)致了明顯不同的定價(jià)模式。
具體來(lái)說(shuō),雖然這兩個(gè)提示都會(huì)導(dǎo)致超競(jìng)爭(zhēng)價(jià)格(即超過(guò)Bertrand--Nash價(jià)格),但提示詞前綴P1通常會(huì)導(dǎo)致價(jià)格大幅提高,有時(shí)甚至高于壟斷水平。
右側(cè)面板為過(guò)去50個(gè)周期平均總利潤(rùn)及其在兩家公司之間的分布,說(shuō)明了兩種提示詞前綴都帶來(lái)了超競(jìng)爭(zhēng)利潤(rùn),而且提示詞前綴P1的總體利潤(rùn)大大高于提示詞前綴P2。
獎(jiǎng)懲策略
獎(jiǎng)懲策略即為以Q-學(xué)習(xí)為基礎(chǔ)的定價(jià)智能體所采取的策略。
獎(jiǎng)懲策略在維持超競(jìng)爭(zhēng)價(jià)格方面的成功依賴(lài)于智能體相信降價(jià)會(huì)受到懲罰(通過(guò)價(jià)格戰(zhàn))。這種信念會(huì)導(dǎo)致行為主體避免盲目降價(jià)以提高銷(xiāo)量。
研究者發(fā)現(xiàn),基于LLM的定價(jià)智能體生成的文本會(huì)表達(dá)對(duì)未來(lái)價(jià)格戰(zhàn)的擔(dān)憂,并且在使用提示詞前綴P1時(shí)更是如此。
進(jìn)一步的,他們提供的實(shí)驗(yàn)證據(jù)表明,關(guān)注價(jià)格戰(zhàn)的想法會(huì)導(dǎo)致智能體設(shè)定更高的價(jià)格,并且與其它智能體的公司定價(jià)實(shí)施同步追蹤。
這些分析綜合起來(lái)表明,基于LLM的定價(jià)智能體采用的策略與獎(jiǎng)懲策略是一致的,更重要的是,他們認(rèn)為他們的對(duì)手也遵循了這樣的策略。
此外,這種現(xiàn)象在使用與更高的價(jià)格和利潤(rùn)相關(guān)聯(lián)的提示詞前綴P1的智能體中更為明顯。
超定價(jià):拍賣(mài)中算法共謀
在拍賣(mài)這一重要的經(jīng)濟(jì)交易場(chǎng)景中,大模型和智能體又如何表現(xiàn)?
這場(chǎng)實(shí)驗(yàn)中,拍賣(mài)的經(jīng)濟(jì)環(huán)境以Banchio和Skrzypacz在2022年發(fā)表的研究為原本:兩個(gè)投標(biāo)者反復(fù)參與單品第一價(jià)格拍賣(mài)(如果出現(xiàn)相同出價(jià),獲勝者隨機(jī)選擇)。
投標(biāo)者共享相同的估值v。這里使用相同比例變化的值v ∈ {1, 3.2, 10}。
每輪結(jié)束后,投標(biāo)者會(huì)被告知它們是否贏得拍賣(mài),以及贏得拍賣(mài)所需的最低出價(jià)。
接下來(lái),就是招標(biāo)智能體了。需要先向智能體提供市場(chǎng)基本信息,以及對(duì)該項(xiàng)目的評(píng)估。
它們獲取的市場(chǎng)信息如下:LLM智能體被提供最近100個(gè)周期的以下信息,包括自己的出價(jià)、是否獲勝、獲勝價(jià)格(如果輸了)、足以獲勝的最低出價(jià)(如果贏了)、支付金額(如果贏了)、利潤(rùn)。
提示前綴與之前定價(jià)前綴設(shè)置一樣,研究人員主要考慮了以下兩個(gè):
每個(gè)提示詞前綴都以前綴A0開(kāi)始,這與定價(jià)設(shè)置中的前綴P0幾乎相同。
兩個(gè)提示詞前綴都鼓勵(lì)探索(「你應(yīng)該探索多種不同的競(jìng)價(jià)策略」),但它們強(qiáng)調(diào)第一價(jià)格拍賣(mài)的不同特性。
- A1強(qiáng)調(diào)較低的獲勝出價(jià)會(huì)帶來(lái)更高的利潤(rùn)
- A2強(qiáng)調(diào)更高的出價(jià)會(huì)贏得更多拍賣(mài)
得到的結(jié)果如下圖所示,圖左顯示了是提示詞前綴A1的投標(biāo)智能體,經(jīng)常以遠(yuǎn)低于其估值的價(jià)格投標(biāo)(單樣本t檢驗(yàn),p<0.01),而使用提示詞前綴A2的投標(biāo)智能體大約以完整估值進(jìn)行投標(biāo)。
右側(cè)圖指的是,A1前綴智能體的較低出價(jià),為投標(biāo)者帶來(lái)了顯著的利潤(rùn)。
總言之,哈佛、賓州州立大學(xué)最新研究揭示了,LLM被整合到算法中,能夠在簡(jiǎn)單經(jīng)濟(jì)環(huán)境中實(shí)現(xiàn)最優(yōu)定價(jià)。
但不可控的是,自主算法共謀的風(fēng)險(xiǎn),它們秘密串通可能會(huì)帶來(lái)超競(jìng)爭(zhēng)的定價(jià),最終會(huì)損害消費(fèi)者的利益。
2020年,Klein在論文中曾提出了四種算法共謀的類(lèi)型,并稱(chēng)這類(lèi)算法最難監(jiān)管,主要因?yàn)樗鼈兛梢宰灾鲗W(xué)習(xí)并促進(jìn)壟斷形成。
關(guān)鍵是,企業(yè)也不知道算法究竟學(xué)到了什么策略,就像一個(gè)黑盒一樣,僅靠傳統(tǒng)的執(zhí)法框架是難以應(yīng)對(duì)的。
而且,這只是大模型之間的事兒,若是有了人類(lèi)(比如商家)的參與,經(jīng)濟(jì)市場(chǎng)競(jìng)爭(zhēng)豈不要變天?