華為、騰訊和阿里來了,英特爾、高通也來了;特斯拉來了,帶著它的 1:1 人形機器人模型;英偉達沒亮相,但它也出現(xiàn)在各個地方,在中國競爭者的演講里,在潛在客戶的詢問里。
這算一個 AI 大會的常規(guī)配置,但 7 月 6 日到 7 月 8 日來上海參加第六屆世界人工智能大會(WAIC)的近 18 萬人里,有珠寶檢測機構(gòu)、公安局的團隊,還有核電公司和醫(yī)院的員工來找機會,甚至有人組織了一些小學(xué)生來參觀,不止一個團。
在增長越來越稀缺、確定性越來越難得的此刻,AI 大模型許諾了一個少有的新可能。各行各業(yè)的人士都帶著他們的問題和迷惑,聚集到上海浦東,當(dāng)他們離去時,一些問題并未得到解答。
“如果大模型是答案,那問題是什么?” 這是一位尋找創(chuàng)業(yè)機會的參展者來了之后的疑問。他之前在字節(jié)跳動工作,現(xiàn)在籌備大模型創(chuàng)業(yè),希望能在這場大會展出的 30 多個大模型上找一些靈感。
逛了一上午后之后,他想到了自己經(jīng)歷的上一輪人工智能熱。AlphaGo 在 2017 年擊敗柯潔,第二年,WAIC 第一次在上海舉辦。當(dāng)時會場里展示最多的各種巨型屏幕,呈現(xiàn)攝像頭監(jiān)控下的車流或街區(qū)。AI 公司給這類系統(tǒng)取名 “智慧城市”。
自那時起,人工智能的發(fā)展就不完全由市場驅(qū)動,而是混合著政府的引導(dǎo)與期待。這次的大模型熱潮也不例外,開幕式和一些規(guī)模較大的論壇都有官員身影,表態(tài)要為推動人工智能產(chǎn)業(yè)發(fā)展提供政策助力。
對比兩次浪潮,這位創(chuàng)業(yè)者有了更多疑問:“CV(計算機視覺)有安防,大模型會有什么呢?” 他不認為會有多少公司愿意每年花上百萬、千萬元買一個并不完美的聊天機器人幫自己回答客服問題或做文檔提煉和摘要。
他的疑問展現(xiàn)了大模型熱潮的另一面:大模型像是雷神之錘,但如果沒有適合它的釘子,就難以發(fā)揮被期許的巨大商業(yè)價值。
各行各業(yè)的人都來了,看大模型能怎么幫自己
7 月 6 日上午 9 點后,還沒有等到 WAIC 開放展館,人潮就已占領(lǐng)了上海世博中心和世博展覽館附近的大小咖啡館,晚到的人只能擠在附近的面館里討論 AI 和大模型,以往只有到中午,這里生意才會好起來。
“黃?!?也在入口附近就位,低聲詢問來往的人 “預(yù)約了沒”。按官方要求,不提前預(yù)約就無法入場。黃牛們說自己能搞定入場問題,“得花 400 元”。
看展的不只 AI 從業(yè)者,展覽館中隨處可見工作人員舉著牌子帶隊參觀,牌子上寫著 “珠寶國檢采購團”“上海市公安局虹口分局”“長城汽車采購團” 等。
在華為辦的大模型論壇中,晚到的媒體記者發(fā)現(xiàn)預(yù)留的媒體座位已被搶占,并不是媒體同行太熱情,而是到場的人實在太多了。兩位中國核電集團的員工也坐在這里,過去幾年他們把人工智能技術(shù)用到了維護、檢修設(shè)備的環(huán)節(jié)中,現(xiàn)在他們關(guān)心大模型:“看能不能找到一些結(jié)合點”。
增長推力漸弱的當(dāng)下,大模型是為數(shù)不多的亮點,過去半年的狂熱炒作后,一些人擔(dān)心被 AI 替代、顛覆,另一些人決心在被替代前跳入潮流。不過這種全行業(yè)的熱情暫時缺乏認知基礎(chǔ),多數(shù)人還不理解大模型到底是什么、能做什么。
“大模型就是大算力、占用更大的存儲空間嗎?” 一位在醫(yī)院工作的人士逛了一圈騰訊展區(qū)后問附近的工作人員。她知道人工智能的視覺能力,已經(jīng)能幫醫(yī)生看 CT 圖像了,但不太了解大模型能幫助醫(yī)院做什么,渴望知道更多。
太快形成的太大期待,往往帶來了等量的失望。展會現(xiàn)場,很多圍在各家展臺電腦前體驗大模型:“寫一個創(chuàng)意咖啡的品牌故事”“寫一個小學(xué)生的出游計劃”。一位參展者瞥見了阿里通義千問展示的 “寫情書” 功能,立即吐槽說:“這什么玩意?能幫我干點實際的事嗎?”
參觀者圍在 WPS 展臺上體驗大模型應(yīng)用,圖片來自 WPS。
沒幾家公司談?wù)撛僭煲粋€ OpenAI 了
送走幾位測試大模型失敗的人后,一位互聯(lián)網(wǎng)公司的參展人員嘆了口氣:“沒辦法,技術(shù)現(xiàn)在還是不太行。”
剛走的那位拿著一道數(shù)學(xué)題測試大模型,讓它算出 “每個數(shù)字都不相同的五位數(shù)有多少個”??吹浇Y(jié)果后,對方揚了揚手機說,“還是 ChatGPT 靠譜些”。
參會前,展臺的這位工作人員看到同行們在幾個月里做出了幾十個大模型,就已經(jīng)有了感覺:做出一個大模型似乎沒那么有技術(shù)壁壘,但要做好很難。WAIC 期間,他抽空體驗了同行的大模型后,這一感覺更強烈了:“效果相差不大,都離 ChatGPT 有差距。”
就在半年前,還有不少公司稱要做中國的 OpenAI。但這次大會的展臺和論壇發(fā)言中,已經(jīng)沒多少人提這個目標了。
新的敘事是:行業(yè)大模型與 “大模型賦能千行百業(yè)”。
華為展出礦山大模型。
華為輪值董事長胡厚崑在 WAIC 開幕式上說,“大模型的目標是應(yīng)該服務(wù)于不同行業(yè)的不同應(yīng)用……才能發(fā)揮更大價值。” 騰訊集團高級執(zhí)行副總裁湯道生在后續(xù)發(fā)言中也表達了類似觀點:“行業(yè)大模型是企業(yè)擁抱大模型的更優(yōu)選項。”
騰訊和華為都沒有在展臺上擺電腦讓人體驗大模型。緊挨著騰訊展臺的阿里巴巴雖然放了十多臺電腦在展區(qū)中心供人體驗,但阿里云的 CTO 周靖人也開始強調(diào)做生態(tài),而不是自研的大模型。他在 WAIC 論壇中說:“阿里云將把促進中國大模型生態(tài)繁榮作為首要目標……讓各行各業(yè)享受大模型技術(shù)紅利。”
風(fēng)向轉(zhuǎn)變并不是大公司放棄研發(fā)更大的模型,而是它們希望先找到一個可行的方式,讓這個不算成熟的新技術(shù)先發(fā)揮價值,創(chuàng)造收入。他們的邏輯是:
通用大模型(類似 ChatGPT 背后的大模型)用起來貴,模型參數(shù)普遍千億起,實際運作起來要花費大量資源,ChatGPT 和 New Bing 一度抽干了微軟積累的數(shù)十萬張 GPU 算力,一般公司根本難以承受。
通用大模型在特定場景效果不好。通用大模型一般基于公開文獻與網(wǎng)絡(luò)信息訓(xùn)練,專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致回答的精準度不夠,“企業(yè)一旦向公眾提供了錯誤信息,可能引起嚴重后果?!?湯道生說。
行業(yè)大模型參數(shù)更小、部署成本更低,針對性訓(xùn)練后,回答特定問題時效果更好。而且大公司為各行業(yè)公司提供訓(xùn)練或部署大模型服務(wù)的云端 MaaS(模型即服務(wù)),也能幫助它們先賣一些云服務(wù)。
體量小些的公司更現(xiàn)實。一位 AI 獨角獸公司首席科學(xué)家說,他們從 2018 年就開始研究大語言模型,前兩年也做出來了寫文章的應(yīng)用,因為沒客戶買單,公司就一直沒有加大投入。ChatGPT 火了后,他們也發(fā)布了自研大模型,但暫時不打算訓(xùn)練規(guī)模更大的模型,因為客戶覺得性價比有限,畢竟訓(xùn)練一個參數(shù)千億的模型要花千萬元人民幣。
不過即使是理論上更便宜,離落地更近的行業(yè)大模型,真要用起來價格依然不菲?!锻睃c LatePost》了解到,中國一家備受關(guān)注的大模型創(chuàng)業(yè)公司的參數(shù) 60 億的大模型,售價為百萬元,千億參數(shù)的售價每年上千萬元——大多數(shù)成本都是芯片算力。
大模型能做什么還不確定,賣裝備的很活躍
大模型具體能做什么,能做到什么程度還在探索中,但大部分人的共識是,淘金前先得準備好裝備。
今年 WAIC 會場的一個明顯變化是國內(nèi) AI 芯片公司的展臺更大、更接近 C 位,也吸引了更多人關(guān)注:燧原科技、天數(shù)智芯、瀚博半導(dǎo)體、沐曦集成電路、登臨科技等芯片公司的展位貼近騰訊、百度,展臺面積也和這些大公司相近。占據(jù)全場最大展臺的華為,單獨拆出了一個昇騰生態(tài)展臺,昇騰是包含 AI 芯片、MindSpore AI 訓(xùn)練框架和軟件服務(wù)的華為 AI 計算全套產(chǎn)品。
每家芯片公司的展臺都人頭攢動,前來咨詢的客戶想知道這些芯片的性能怎樣、具體可以做什么。最常見的一個問題是:可以替代 A100 嗎?
中國 AI 芯片公司展臺比往年更大。
兩年多前由英偉達推出的 A100 GPU,現(xiàn)在幾乎是訓(xùn)練大模型的標配。當(dāng) ChatGPT 橫空出世,四處涌現(xiàn)的 AI 初創(chuàng)公司和科技巨頭們爭相購買 A100。美國政府針對 A100 等 AI 芯片的出口管制更加劇了其在中國的緊缺程度,但同時也讓國產(chǎn)芯片公司們看到了替代機會。華為昇騰計算業(yè)務(wù)總裁張迪煊接受采訪時說,“過去是我們找企業(yè),現(xiàn)在是許多企業(yè)找過來。”
不同于開發(fā)大模型的公司還在嘗試各種最終應(yīng)用場景,芯片公司們展示的東西明確、直觀得多:在各芯片展臺的顯眼位置,往往擺放著各型號芯片,和搭載了其 AI 芯片的服務(wù)器,它們看起來是一個個大機箱,其中插著數(shù)排 AI 加速卡。各家公司也會用現(xiàn)場計算機展示在自己的芯片支持下, AI 大模型或 AIGC 的應(yīng)用效果:包括對話機器人、AI 繪畫等。
英偉達沒在 WAIC 上設(shè)展臺、沒有一場冠名論壇,也沒拿任何獎項,在芯片專場論壇中,英偉達只派來一位技術(shù)總監(jiān),他最后一個上臺,排在高通、AMD 和英特爾之后。但幾乎每家芯片公司宣傳產(chǎn)品時都會對比英偉達 A100 的指標;燧原科技 CEO 趙立冬在同場論壇里演講時,就以英偉達市值已突破萬億美元開場,以此說明華爾街正在用真金白銀押注 AI 計算大機會。
中國政府對扶持 AI 算力的重視也更甚以往:去年大會的芯片專場論壇的領(lǐng)導(dǎo)致辭環(huán)節(jié),有一位上海市副市長出席,今年則來了上海市市委常委、浦東新區(qū)區(qū)委書記,上海市經(jīng)信委主任,以及工信部科技司的一位副司長。
奮力賣 “裝備” 的人除了芯片公司,還有云計算廠商和數(shù)據(jù)服務(wù)公司,以及獵頭公司和地方園區(qū)。
大多數(shù)公司很難買到 GPU 芯片訓(xùn)練大模型,更好的方式是直接租用云廠商供應(yīng)的算力。微軟 Azure、亞馬遜 AWS 今年都上了 WAIC 的主論壇。
《晚點 LatePost》了解到,數(shù)據(jù)采集和標注平臺澳鵬今年下了重注,把全年大多數(shù)展出預(yù)算都放在了 WAIC 上;它的中國同行——股價曾在短短一個月之內(nèi)上漲超 2 倍的海天瑞聲,則是第一次參會,現(xiàn)場的工作人員說,除了接待接連不斷的潛在客戶,還有 “許多股民來感謝我們”。
創(chuàng)業(yè)生態(tài)里的各種服務(wù)方也在尋找客戶。一位參展企業(yè)人士說,他一個上午遇到了好幾波獵頭和地方園區(qū)招商人員,接了一沓名片。不管想嘗試什么新機會,人才和經(jīng)營場地,都是一批公司要付出的成本,是另一批公司和地方的新發(fā)展機會。
大模型帶動通用機器人成熱點,無人車、元宇宙退潮
在各種相對抽象的應(yīng)用和系統(tǒng)解決方案中,機器人是少有的能 “看得見、摸得著” 的應(yīng)用方向。
大模型熱起來的這半年,一個名叫 “具身智能”(Embodied AI)的概念也獲得關(guān)注。簡單來說,具身智能是指人工智能軟件與硬件結(jié)合起來,去解決現(xiàn)實世界的問題。今年 5 月,英偉達 CEO 黃仁勛說,具身智能會是下一個 AI 浪潮,具身智能的典型代表就是機器人,尤其是能以同一形態(tài)產(chǎn)品,完成多種復(fù)雜任務(wù)的通用機器人。
WAIC 現(xiàn)場,機器狗和人形機器人肉眼可見地多了起來,主辦方稱有 20 多個,往年則是個位數(shù)。
會場中的熱鬧場景,是一群人圍著機器狗 “逗狗”,嘗試推倒它、騎它。云深處的機器狗在一次表演爬臺階時踏空摔了下來,馬上在圍觀的人群中激起一陣密集的嘆息:“完了、完了……完了”。
人們圍觀機器狗。來源:視覺中國。
關(guān)于大模型和機器人具體怎么結(jié)合,從業(yè)者現(xiàn)在莫衷一是。有觀眾問機器狗公司宇樹科技的工作人員:“你們會把大模型用到機器狗上嗎?” 工作人員愣了一會兒,說:“還沒有發(fā)現(xiàn)什么可以做的”。
一家機器人公司創(chuàng)始人告訴《晚點 LatePost》,大模型現(xiàn)階段在機器人上的明顯應(yīng)用方向,是用自然語言替代代碼,直接向機器人輸入指令,讓機器人有部分 “常識”,能把人想傳達的任務(wù)分拆成各種機器人子任務(wù);但子任務(wù)的執(zhí)行需要依賴機器人基礎(chǔ)能力,如導(dǎo)航、規(guī)劃、控制等,大模型可能有幫助,但不是替代和顛覆。
相比機器狗公司面對大模型的猶豫,開發(fā)人形機器人的公司樂觀多了。達闥科技發(fā)布了 “RobotGPT 行業(yè)大模型”,宣稱要 “引領(lǐng)具身智能新時代”。他們運了十幾個機器人到現(xiàn)場,讓它們擺成一列跳 “千手觀音”。
達闥科技的機器人表演 “千手觀音”。
它在這場 AI 大會上遇到了新對手。展臺就在達闥對面的傅利葉智能。這家公司之前做智能復(fù)健設(shè)備,現(xiàn)在發(fā)布了人形機器人,同樣宣布要 “引領(lǐng) AI 進入具身智能時代”。
最抓人眼球的人形機器人是特斯拉的 Optimus。在保護機器人的紅線之外,聚集的人群爭著鉆得近一點再近一點,好拍照記錄,仿佛在膜拜一尊神像,盡管這只是一個 1:1 的模型。
參觀者擠到特斯拉人形機器人 Optimus 前拍照。
路過的人常常問工作人員 “它能動嗎?” 甚至有人靠上下前后搖動手機,硬是拍出了動感效果?!半m然是模型,但很震撼”,一位現(xiàn)場的年輕人說,他目測這個機器人有 1.9 米高,這也許是黑科技帶來的光環(huán),Optimus 的官方身高是 1.72 米。
往年,這樣的盛況屬于無人車和元宇宙。
2021 年的人工智能大會儼然像是另一場上海車展。自動駕駛公司嬴徹科技、小馬智行和圖森未來不惜重金將高 4 米、近 10 噸重的卡車實物運到展臺。AutoX、上汽、華為車 BU、百度 Apollo、商湯科技,乃至做汽車芯片的芯馳科技,都直接展示了搭載自家技術(shù)或產(chǎn)品的汽車。WAIC 還專門設(shè)立了一個無人車體驗區(qū),會場接駁都用了無人小巴。
到了今年,體驗區(qū)和無人小巴都不見了。只有上汽智己、集度、特斯拉等少數(shù)車企的展位上還有車,兩年前的 “卡車三雄”,今年只剩圖森未來展示了一個用塑料盒包裹起來的感知套件,其他無人車公司幾乎都沒來。
圖森未來 2021 年展臺(上)和 2023 年展臺(下)的對比。
大會的智能駕駛論壇被安排到 WAIC 最后一天,云驥智行聯(lián)合創(chuàng)始人曹光植在參與圓桌討論時一邊鼓勵同行共渡難關(guān),一邊自嘲:“自動駕駛這么一個陽春白雪的事情,怎么被我們卷成了這樣?”
元宇宙也有類似冷遇。去年 WAIC 大會把元宇宙概念嵌進了主題名,“智聯(lián)萬物、元生無界”,Meta 大中華區(qū)總裁梁幼莓受邀在開幕式上演講,主辦方還在世博中心、徐匯西岸、張江分會場、東方明珠和武康大樓等地設(shè)置了元宇宙打卡點。
一年過去,只剩下為數(shù)不多的 XR (擴展現(xiàn)實)企業(yè)將元宇宙作為宣傳點。在官方設(shè)置的 10 個前沿技術(shù)中,今年元宇宙相關(guān)論壇只有 3 個,是去年的五分之一。從主會場的入口一直走到盡頭,才能看到一些元宇宙相關(guān)公司的小展位。無論是自動駕駛還是元宇宙,在當(dāng)下風(fēng)口過去、融資困難的背景下,企業(yè)們大多將有限的預(yù)算留給了維持公司經(jīng)營。
當(dāng)一種新技術(shù)熱潮顯現(xiàn),往往有兩種演進路徑:一是新技術(shù)兌現(xiàn)了價值,成為基礎(chǔ)設(shè)施的一部分,不再被關(guān)注,比如互聯(lián)網(wǎng)、推薦算法。另一個是新技術(shù)短期內(nèi)無法兌現(xiàn)價值,然后被新的熱潮搶走資源與風(fēng)頭?,F(xiàn)在大模型成為新熱點,但過去的一輪輪技術(shù)炒作后,局內(nèi)和局外人都已冷靜很多。那些真正想在這個新機會里做些事情的從業(yè)者,其實希望大眾的熱情和期待都更務(wù)實一些。
騰訊云副總裁吳運聲說,騰訊已經(jīng)聯(lián)合金融、文旅、政務(wù)、傳媒、教育等十多個行業(yè)客戶,打造超過 50 個行業(yè)大模型解決方案。據(jù)我們了解,這些方案暫時都沒有上線。他說,現(xiàn)在是大模型發(fā)展的初級階段。
朱麗琨對此文亦有貢獻。
上一篇:AI難成消費電子的燈塔