離大模型走進(jìn)人們的視野已經(jīng)過(guò)去近一年的時(shí)間,在AI大模型的浪潮下,各大科技企業(yè)爭(zhēng)先恐后的推出了各自的大模型產(chǎn)品。與此同時(shí),各行業(yè)企業(yè)也對(duì)大模型保持著高度關(guān)注。
如果說(shuō),各大廠商紛紛推出大模型產(chǎn)品形成“百模大戰(zhàn)”的局勢(shì),是大模型這場(chǎng)“戰(zhàn)役”的上半場(chǎng)的話,那么這場(chǎng)“戰(zhàn)役”的下半場(chǎng)將更聚焦在大模型產(chǎn)品的整合能力,以及平臺(tái)化、行業(yè)化的發(fā)展方向。
下半場(chǎng)開(kāi)打,平臺(tái)化、行業(yè)化將成關(guān)鍵賽道
從大模型這一年的發(fā)展可以看出,目前各個(gè)廠商的大模型幾乎是“各自為戰(zhàn)”,都通過(guò)自身的產(chǎn)品意圖搶占更多的市場(chǎng),以大模型“鼻祖”ChatGPT為例,ChatGPT是個(gè)應(yīng)用,可以看作一個(gè)APP,而GPT4則是個(gè)大模型,構(gòu)建了類似大模型的生態(tài),讓企業(yè)可以以此為基礎(chǔ),打造自身的大模型。
從上述案例可以看出,過(guò)去近一年的時(shí)間,各家都將主要精力放在類似“ChatGPT”的產(chǎn)品打磨上,落地點(diǎn)在應(yīng)用側(cè),而對(duì)于企業(yè)側(cè)而言,目前行業(yè)還是較缺乏一個(gè)平臺(tái),讓企業(yè)可以靈活調(diào)用各家大模型產(chǎn)品,或者基于某家的產(chǎn)品開(kāi)放針對(duì)自身需求的大模型。在神州數(shù)碼副總裁CTO李剛看來(lái),大模型如果想要在企業(yè)側(cè)實(shí)現(xiàn)應(yīng)用的爆發(fā),需要一個(gè),甚至多個(gè)開(kāi)源、開(kāi)放的大模型平臺(tái)。
說(shuō)到企業(yè)級(jí)大模型應(yīng)用,就不得不提一提行業(yè)大模型,鈦媒體觀察發(fā)現(xiàn),目前行業(yè)級(jí)大模型還處于發(fā)展的初級(jí)階段,雖然有很多家企業(yè)推出了行業(yè)大模型,但是應(yīng)用并不很好。
以發(fā)展較快的金融行業(yè)為例,今年3月,彭博首度針對(duì)金融業(yè)推出大型語(yǔ)言模型BloombergGPT,引發(fā)市場(chǎng)對(duì)金融垂直領(lǐng)域大模型的關(guān)注;6月,哥倫比亞大學(xué)聯(lián)合上海紐約大學(xué)推出FinGPT 。
在國(guó)內(nèi),7月,華為全新發(fā)布盤(pán)古大模型,金融行業(yè)大模型正是其中數(shù)個(gè)行業(yè)通用大模型之一;9月,螞蟻集團(tuán)正式發(fā)布自研“螞蟻基礎(chǔ)大模型”,以及在此基礎(chǔ)上進(jìn)行定制的“螞蟻金融大模型”。
李剛對(duì)鈦媒體表示,目前市面上的大模型種類主要分為幾類,一類是通用的基礎(chǔ)大模型,一般來(lái)說(shuō),這些大模型通過(guò)自然語(yǔ)言的語(yǔ)料構(gòu)建數(shù)據(jù)庫(kù),經(jīng)過(guò)清洗、訓(xùn)練等操作,打造了基礎(chǔ)大模型,“這類模型,語(yǔ)料庫(kù)越大、參數(shù)量越大,能力就越強(qiáng)。”李剛表示。
另一類就是行業(yè)大模型,這類模型具有極強(qiáng)的專業(yè)性,需要大量行業(yè)專業(yè)知識(shí)庫(kù),“目前,這個(gè)行業(yè)知識(shí)庫(kù)的語(yǔ)料需控制在20%,不多不少。”李剛強(qiáng)調(diào),“超過(guò)20%,訓(xùn)練出來(lái)的大模型可能就‘不會(huì)說(shuō)人話’,造成溝通障礙;少于20%,又不具備行業(yè)的專業(yè)性?!?/p>
打造大模型的“PaaS”層
就像云計(jì)算有IaaS、PaaS、SaaS之分一樣,在神州數(shù)碼戰(zhàn)略營(yíng)銷部總經(jīng)理皇甫子喬看來(lái),大模型時(shí)代,企業(yè)也需要一個(gè)類似云時(shí)代PaaS平臺(tái)。
為了給企業(yè)構(gòu)建一個(gè)更好使用大模型的平臺(tái),神州數(shù)碼近日正式發(fā)布了神州問(wèn)學(xué)平臺(tái),談及平臺(tái)發(fā)布的意義時(shí),李剛對(duì)鈦媒體表示:“以神州問(wèn)學(xué)平臺(tái)為核心,我們不做基礎(chǔ)大模型,而是做大模型的集成與應(yīng)用開(kāi)發(fā)交付平臺(tái),從而加速企業(yè)AI創(chuàng)新;我們做大數(shù)據(jù)的服務(wù)伙伴,從而加速企業(yè)數(shù)據(jù)治理升級(jí);我們做生態(tài)紐帶、模型市場(chǎng)、數(shù)據(jù)集市、應(yīng)用商店,從而加速產(chǎn)業(yè)創(chuàng)新與生態(tài)破局?!?/p>
今年初,華為云發(fā)布了盤(pán)古大模型,并將大模型按照L0、L1、L2進(jìn)行了分級(jí)。按照華為云的分類,L0指基礎(chǔ)大模型,L1指行業(yè)大模型,L2則是指面向更加細(xì)分場(chǎng)景的推理模型。
基礎(chǔ)大模型方面,以圖網(wǎng)絡(luò)大模型為例,一個(gè)大模型可以適配工藝優(yōu)化、時(shí)序預(yù)測(cè)、智能分析等多個(gè)場(chǎng)景,同時(shí)應(yīng)用在金融、煤礦、制造等多個(gè)行業(yè)。
行業(yè)大模型方面,華為云推出了如盤(pán)古金融大模型、盤(pán)古礦山大模型、盤(pán)古電力大模型、盤(pán)古制造質(zhì)檢大模型、盤(pán)古藥物分子大模型等行業(yè)大模型。
推理模型方面,以在電力行業(yè)為例,華為云基于盤(pán)古電力大模型,針對(duì)無(wú)人機(jī)電力巡檢細(xì)分場(chǎng)景,通過(guò)一次預(yù)訓(xùn)練+下游任務(wù)的微調(diào),推出盤(pán)古電力巡檢大模型,解決了無(wú)人機(jī)智能巡檢系統(tǒng)(缺陷檢測(cè))中的小樣本學(xué)習(xí)、主動(dòng)學(xué)習(xí)、增量學(xué)習(xí)等問(wèn)題,解決了海量數(shù)據(jù)標(biāo)注工作量大和缺陷種類繁多的問(wèn)題。
上述是華為云對(duì)于大模型的理解,以及華為云的一些產(chǎn)業(yè)布局?;诖耍矢ψ訂虒?duì)鈦媒體表示,神州數(shù)碼問(wèn)學(xué)平臺(tái)在幫助企業(yè)從L0到L2行業(yè)應(yīng)用場(chǎng)景落地過(guò)的程中,將起到“轉(zhuǎn)換器”的作用,“為企業(yè)提供一個(gè)類似云計(jì)算時(shí)代PaaS平臺(tái)的能力?!被矢ψ訂倘缡钦f(shuō)。
無(wú)獨(dú)有偶,百度CTO王海峰也曾公開(kāi)表示,面對(duì)大模型產(chǎn)業(yè)化的挑戰(zhàn),行業(yè)需要類似芯片代工廠模式,采用“集約化生產(chǎn),平臺(tái)化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過(guò)程封裝起來(lái),通過(guò)低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù)。
據(jù)鈦媒體了解,目前,這一產(chǎn)業(yè)化路徑已在文心大模型產(chǎn)業(yè)實(shí)踐中得到驗(yàn)證,百度與各行業(yè)頭部企業(yè)、機(jī)構(gòu)共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等行業(yè)大模型。
更低成本、更低門檻是目標(biāo)
雖然大模型已經(jīng)逐漸向各行各業(yè)滲透,但就現(xiàn)階段大模型發(fā)展來(lái)看,對(duì)于企業(yè)級(jí)用戶而言,大模型的使用成本依然讓很多企業(yè)望而卻步。
以GPT-3為例,英偉達(dá)曾披露訓(xùn)練一次1750億參數(shù)的GPT-3需要34天,使用1024張A100 GPU芯片,單次訓(xùn)練成本高達(dá)1200萬(wàn)美元。為了訓(xùn)練超大規(guī)模的AI模型,微軟甚至為OpenAI構(gòu)建的一臺(tái)排名世界前五的超級(jí)計(jì)算機(jī)。
與此同時(shí),據(jù)國(guó)盛證券《ChatGPT 需要多少算力》報(bào)告估算,大模型的前期訓(xùn)練成本很高,一次訓(xùn)練的成本超過(guò)百萬(wàn)美元。這個(gè)費(fèi)用不僅涵蓋了模型的架構(gòu)、算法和訓(xùn)練數(shù)據(jù)的選擇,還包括了模型訓(xùn)練所需要的大量計(jì)算資源和時(shí)間成本。而且隨著大模型版本的升級(jí),其訓(xùn)練成本也呈幾何式增長(zhǎng)。
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏也曾指出:“無(wú)論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語(yǔ)言模型。深度學(xué)習(xí)、自然語(yǔ)言處理,需要多年的堅(jiān)持和積累,沒(méi)法速成?!?/p>
面對(duì)如此高額的大模型使用成本和使用門檻,是一般企業(yè)承擔(dān)不起的,也正是如此,目前為止,還沒(méi)有一個(gè)真正意義上完善落地的行業(yè)大模型產(chǎn)品面世。對(duì)此,皇甫子喬表示,大模型的使用成本是很多企業(yè)應(yīng)用大模型賦能業(yè)務(wù)的最大阻礙,而神州問(wèn)學(xué)平臺(tái)的定位就是希望通過(guò)開(kāi)源的形式,讓企業(yè)以更低的選擇成本,使用大模型產(chǎn)品?!吧裰輪?wèn)學(xué)主要包含兩個(gè)部分,一部分是平臺(tái),另一部分是開(kāi)箱即用的場(chǎng)景應(yīng)用?!被矢ψ訂虒?duì)鈦媒體表示,“這兩部分一方面希望集合更多生態(tài)伙伴,共同賦能用戶;另一方面,希望企業(yè)可以更快、更便捷的使用大模型產(chǎn)品。”
將大模型的使用成本和使用門檻降低是行業(yè)內(nèi)的共識(shí),無(wú)論是“一卡難求”的GPU,還是高額的電費(fèi),都是現(xiàn)階段企業(yè)應(yīng)用大模型的門檻,而諸如神州問(wèn)學(xué)、百度千帆、昆侖萬(wàn)維等,“風(fēng)格迥異”,卻目標(biāo)相同——“助力大模型落地”的平臺(tái)級(jí)產(chǎn)品的涌現(xiàn),以及大模型生態(tài)中合作伙伴的不斷增加,企業(yè)應(yīng)用大模型的門檻和成本必將進(jìn)一步的降低,我們離行業(yè)大模型的普惠也將越來(lái)越近。