IT之家 6 月 5 日消息,市場(chǎng)有消息稱(chēng)華為大模型“盤(pán)古 Chat”已申請(qǐng)相關(guān)商標(biāo),將于 7 月 7 日發(fā)布。據(jù)證券時(shí)報(bào),華為官方表示華為不會(huì)有“盤(pán)古 Chat”此類(lèi)命名,也不“對(duì)標(biāo)”業(yè)界產(chǎn)品,不過(guò)官方口徑未直接提及盤(pán)古大模型的發(fā)布。
IT之家查詢(xún)公開(kāi)資料獲悉,華為盤(pán)古系列基礎(chǔ)大模型于 2021 年正式對(duì)外發(fā)布,包括 NLP(自然語(yǔ)言處理)、CV(機(jī)器視覺(jué))和科學(xué)計(jì)算大模型;后續(xù)又發(fā)布了礦山、藥物分子、氣象、海浪等行業(yè)大模型。
據(jù)介紹,NLP 是首個(gè)千億參數(shù)中文預(yù)訓(xùn)練大模型,CV 大模型則首次達(dá)到 30 億參數(shù)。盤(pán)古 CV 大模型業(yè)界最大 CV 大模型、首次實(shí)現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學(xué)習(xí)能力上的業(yè)界第一;盤(pán)古氣象大模型提供秒級(jí)天氣預(yù)報(bào);紫東.太初是全球首個(gè)圖、文、音三模態(tài)大模型。
對(duì)于盤(pán)古大模型定位,華為內(nèi)部團(tuán)隊(duì)確立了三項(xiàng)最關(guān)鍵的核心設(shè)計(jì)原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強(qiáng),能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場(chǎng)景。
華為云官網(wǎng)顯示,盤(pán)古大模型由 NLP 大模型、CV 大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型等多個(gè)大模型構(gòu)成,通過(guò)模型泛化,解決傳統(tǒng) AI 作坊式開(kāi)發(fā)模式下不能解決的 AI 規(guī)?;?、產(chǎn)業(yè)化難題,可以支持多種自然語(yǔ)言處理任務(wù),包括文本生成、文本分類(lèi)、問(wèn)答系統(tǒng)等等。
華為表示,盤(pán)古 NLP 大模型由華為云、循環(huán)智能和鵬城實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā),具備領(lǐng)先的語(yǔ)言理解和模型生成能力:在權(quán)威的中文語(yǔ)言理解評(píng)測(cè)基準(zhǔn) CLUE 榜單中,盤(pán)古 NLP 大模型在總排行榜及分類(lèi)、閱讀理解單項(xiàng)均排名第一,刷新三項(xiàng)榜單世界歷史紀(jì)錄;總排行榜得分 83.046,多項(xiàng)子任務(wù)得分業(yè)界領(lǐng)先,向人類(lèi)水平(85.61)邁進(jìn)了一大步。
具體來(lái)看,盤(pán)古 NLP 大模型首次使用 Encoder-Decoder 架構(gòu),兼顧 NLP 大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。下游應(yīng)用中,僅需少量樣本和可學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配,這一模型在智能輿論以及智能營(yíng)銷(xiāo)方面都有不錯(cuò)的表現(xiàn)。