半年前,大洋彼岸發(fā)布了GPT-4大模型。OpenAI的工作人員介紹說,相比起過往發(fā)布的模型,這款新的大模型不僅能通過律師考試,在SAT中拿到1410分,識(shí)別圖片,它甚至開始理解人類的幽默感,講出一些笑話,還能給你指出笑點(diǎn)在哪里。
有網(wǎng)友立刻試驗(yàn)了下,發(fā)現(xiàn)GPT-4真的能理解一些網(wǎng)絡(luò)段子,哪怕是用中文講出來的。
比如暴打一頓之后,水土不服的病人終于服了。GPT-4能立刻理解到:
這是一個(gè)雙關(guān)。
AI發(fā)展如此迅速,已經(jīng)開始深入到每個(gè)人周圍。從川普念唐詩到藥物研發(fā),再到家教,寫代碼。
前不久的舊金山,拜登就說他會(huì)見的領(lǐng)導(dǎo)人,沒有人不愿意和他談?wù)勅斯ぶ悄艿?。OpenAI也成了一個(gè)關(guān)于人工智能大模型的圣地。掌門人從掃地出門又回到公司,一次次引爆熱點(diǎn)。
國內(nèi)也有不少大模型。什么百度的文心一言,科大訊飛的星火,各家都說自己的模型最最棒。比如科大訊飛就說他們的模型已經(jīng)超過chatGPT了,距離GPT-4的距離也就那么一點(diǎn)兒了。
在這里,做好產(chǎn)品的的確不如講好故事的。
還是來看看外國同行怎么評價(jià)。今年4月,微軟副總裁Brad Smith在接受《日經(jīng)亞洲》的采訪時(shí)也被問到了類似的問題。
這位副總裁給出了三家他認(rèn)為處于創(chuàng)新前沿的實(shí)體,第一是OpenAI,第二家是谷歌,第三家,來自中國,卻是大家都很陌生的一個(gè)名字:
北京智源院。
1
2018年6月,北京懷柔科學(xué)城專家座談會(huì)上,前微軟研究院副院長張宏江也應(yīng)邀出席。
這位計(jì)算機(jī)領(lǐng)域的學(xué)者,剛剛在guide2research評選的計(jì)算機(jī)與電子研究領(lǐng)域的學(xué)者top1000中,名列中國籍第一。
在會(huì)上,張宏江向領(lǐng)導(dǎo)提出,能不能建立一個(gè)新型的科研機(jī)構(gòu),獨(dú)立于高校、企業(yè),追求更系統(tǒng),更宏觀的目標(biāo)。
在他看來,彼時(shí)國內(nèi)都是一個(gè)個(gè)實(shí)驗(yàn)室,屬于小單元。大家關(guān)起門來搞自己的研究,很難在前沿方向做出探索。
2016年,張宏江去美國,參觀過OpenAI,和他們的團(tuán)隊(duì)有過交流。他很欣賞這種非盈利民間機(jī)構(gòu)的形式,想著能不能在中國也搞一個(gè)。
彼時(shí),大家的目光都還放在打敗李世石的AlphaGo和谷歌實(shí)驗(yàn)室身上,OpenAI還遠(yuǎn)不如現(xiàn)在這樣引人關(guān)注。
然而,現(xiàn)場的北京市領(lǐng)導(dǎo)也是學(xué)術(shù)界出身。聽到這個(gè)想法,馬上說:
這個(gè)主意好。
領(lǐng)導(dǎo)的決策快,北京的行動(dòng)也很快。
幾個(gè)月后,北京發(fā)布智源行動(dòng)計(jì)劃,北京智源院正式成立,張宏江擔(dān)任理事長,北大計(jì)算機(jī)系主任黃鐵軍擔(dān)任院長。
整個(gè)研究院的隊(duì)伍堪稱豪華。包括北大、清華、中科院、百度、字節(jié)、美團(tuán)等多個(gè)國內(nèi)頂級(jí)高校和互聯(lián)網(wǎng)企業(yè)都囊括其中。
和傳統(tǒng)的研究機(jī)構(gòu)不同,金主爸爸北京市沒有給研究院下達(dá)什么KPI,論文數(shù)量,具體任務(wù)。他們只有一個(gè)要求,鞏固北京在中國AI領(lǐng)軍地位的底線:
5~10年成為全球AI創(chuàng)新策源地。
人工智能是個(gè)高度交叉的前沿學(xué)科。涉及到數(shù)學(xué)、神經(jīng)、計(jì)算機(jī)、電子工程等多個(gè)領(lǐng)域。智源成立后發(fā)起的第一個(gè)計(jì)劃,叫做智源學(xué)者。內(nèi)容很簡單,就是:
找人,發(fā)錢,資助研究員在本學(xué)科和人工智能的交叉部分進(jìn)行積極探索。
但問題是,因?yàn)闆]有具體的目標(biāo)、成果考核,如何保證拿到錢的人不會(huì)亂燒經(jīng)費(fèi)?
經(jīng)過討論,他們想出來了一個(gè)簡單粗暴的方法,直接找到該領(lǐng)域內(nèi)最權(quán)威的學(xué)術(shù)大牛,再請他推薦幾位優(yōu)秀的學(xué)者,而后經(jīng)過投票,選出排名最靠后的一個(gè)人,再在業(yè)內(nèi)評選,看看這個(gè)“最后一名”,是不是也是業(yè)內(nèi)公認(rèn)的頂尖學(xué)者。
在智源院看來,這種情況下,這些久負(fù)盛名的大牛們不太好意思推薦一些學(xué)術(shù)圈“混子”,而只要找到真正有科研精神的科學(xué)家,他們也不會(huì)做出讓自己都感覺汗顏的工作。
北大數(shù)學(xué)系的林教授是智源院最早贊助的學(xué)者之一。2019年,經(jīng)過推薦,智源院找到林教授,愿意以每年贊助的形式,資助林教授開展和人工智能相關(guān)的統(tǒng)計(jì)學(xué)研究。
這年頭,很多企業(yè)機(jī)構(gòu)都會(huì)贊助研究。但主要集中在能出成果的工程類學(xué)科,誰會(huì)每年上百萬的投入到數(shù)學(xué)系這種純理論院系?
就連很多政府機(jī)構(gòu)也很少資助這種基礎(chǔ)研究。畢竟,你給領(lǐng)導(dǎo)看什么機(jī)械狗啥的,大家都能看明白,這種純理論的東西:
要怎么給領(lǐng)導(dǎo)匯報(bào)?
林教授一開始對這種上來就要塞錢的開場白也很懵。但這樣的理論研究十分有必要,很多時(shí)候,科學(xué)理論往往會(huì)落后于實(shí)踐。很多企業(yè)在調(diào)整參數(shù)時(shí)往往只能跟著感覺走,甚至?xí)iT挑選合適、匹配自己模型的參數(shù),造成統(tǒng)計(jì)學(xué)上的誤差。
林教授舉了個(gè)例子,一些企業(yè)測試了100組參數(shù),只有1~2組數(shù)據(jù)很漂亮,大家搞不懂為什么有的參數(shù)表現(xiàn)好,有的參數(shù)表現(xiàn)不好,那就重點(diǎn)宣傳這1~2組:
剩下的我壓根不提。
這對行業(yè)來說,并不是什么好事。有了理論上的開拓和證明,實(shí)踐中調(diào)整參數(shù),優(yōu)化算法,就有了更多的指導(dǎo),而不再只跟著感覺走。
對于企業(yè)來說,理論上的探索也不是他們感興趣的方向,也不會(huì)投入什么資金去探索。
企業(yè)不做的事情,那就智源院來做;企業(yè)不投的錢,那就北京市出資。按黃院長的計(jì)劃,智源學(xué)者要遴選一支人數(shù)在300人的學(xué)者團(tuán)隊(duì),以每年每人100~150萬的方式,資助他們進(jìn)行基礎(chǔ)理論研究。
這筆錢,一半支持開展研究:
一半直接給到研究員本人。
不要求結(jié)果,反而往往有結(jié)果。2020年當(dāng)年,機(jī)器學(xué)習(xí)和計(jì)算神經(jīng)科學(xué)領(lǐng)域國際頂會(huì)NeurIPS收錄的1899篇論文里,智源有35篇入圍。
今年財(cái)新峰會(huì)上,李劍閣說過一句話。他說根據(jù)過往的經(jīng)驗(yàn),我們想要的結(jié)果:
往往不是抓出來的,而是放出來的。
2
2020年,OpenAI發(fā)布了GPT-3,引來了智源院的關(guān)注。
大家在雁棲湖開了一場會(huì),一致認(rèn)定要開展中國自己的大模型研究。從雁棲湖回來后,他們發(fā)布了一個(gè)英雄帖,招攬各領(lǐng)域有興趣的專家。
項(xiàng)目組很快就得到了響應(yīng)。從清華、北大、人大、中科院,甚至阿里這種企業(yè)的研究員紛紛舉手,成員迅速達(dá)到了上百人:
很奇怪,當(dāng)時(shí)大家都沒有猶豫。
智源院拿著這個(gè)計(jì)劃,又找到時(shí)任北京市領(lǐng)導(dǎo)。他們又一次獲得空前支持。在某些人看來人工智能純屬人工智障的時(shí)候,領(lǐng)導(dǎo)就斷言大模型將是人工智能領(lǐng)域的核爆點(diǎn):
沒說的,給錢。
僅僅半年后,悟道1.0版本就正式上線。這個(gè)匯聚了中國頂尖高校學(xué)者、企業(yè)研究員的項(xiàng)目,只比GPT-3晚了一年,成為中國第一個(gè)超大規(guī)模人工智能模型。
隨后,悟道2.0,悟道3.0也跟著上線。
但隨著chatGPT爆火,新的問題又出現(xiàn)了。越來越多的企業(yè)、投資人,開始注意到了AI和大模型,作為全國最早開展研究的機(jī)構(gòu),智源院開始不斷被挖墻腳。
張宏江至今都記得,自己一個(gè)非??粗氐膶W(xué)生,被人挖走,難過了好久。
但很快,他們就不糾結(jié)了。能成為大模型領(lǐng)域的黃埔軍校,是一件好事。用黃鐵軍院長的話來說:
肉都是爛在鍋里。
通過政府資金,預(yù)先對前沿科技探究,等到市場開始接受,又把培養(yǎng)好的種子發(fā)給市場,這也是智源院存在的意義之一。
現(xiàn)在,智源系的人工智能人才遍布各大企業(yè)和創(chuàng)業(yè)公司。智譜AI的創(chuàng)始人唐杰曾是智源的副院長,融資10億的月之暗面創(chuàng)始人楊植麟?yún)⑴c過悟道開發(fā),就連字節(jié)等大廠的大模型團(tuán)隊(duì)領(lǐng)頭人,也或多或少參與了智源的項(xiàng)目。
不僅如此,智源院還直接把自己的悟道3.0全面開源。其中的天鷹基礎(chǔ)語言模型還是可以商用的模型,也通通開放。
智源院曾經(jīng)做過一次調(diào)研,國外發(fā)布的39個(gè)開源大模型里,16個(gè)可商用。國內(nèi)發(fā)布的28個(gè)開源大模型里,可以商用的:
就1個(gè)。
開放是北京市政府很早就確立的目標(biāo)。早在智源院剛成立的時(shí)候,領(lǐng)導(dǎo)表示,要建設(shè)開源的人工智能工具,把政府、社會(huì)、企業(yè)的數(shù)據(jù)都放在上面:
歡迎全球的人工智能研究人員參與使用。
在北京最新的《關(guān)于加快建設(shè)全球數(shù)字經(jīng)濟(jì)標(biāo)桿城市的實(shí)施方案》里,開放被提及了11次。
3
從智源大廈的頂樓望去,五道口的車流清晰可見。
很多時(shí)候,智源院的研究員們會(huì)在這個(gè)天臺(tái)上舉辦一些聚餐,呼吸一下新鮮空氣,大家三三兩兩分享著新的idea,交流著項(xiàng)目最新的進(jìn)展。
他們大多都很年輕,有的梳著一頭披頭士般的長發(fā),拿著一袋快餐店里點(diǎn)的薯?xiàng)l,坐在電腦前碼著代碼,或者看看最新的論文。
在辦公樓的一角,有一個(gè)透明的展柜,里面放著從昇騰910到摩爾線程、寒武紀(jì)幾乎全部國產(chǎn)用于AI訓(xùn)練的芯片。
智源院說他們正在搞一個(gè)新東西,就是希望能把國內(nèi)各廠商生產(chǎn)的芯片,做一些配套生態(tài)上的標(biāo)準(zhǔn)化。
對于GPU來說,最重要的是生態(tài),而不是算力。老黃一統(tǒng)整個(gè)AI芯片江湖,不是因?yàn)镹vida的芯片算力有多強(qiáng),而是因?yàn)镃UDA的存在。
對智源院來說,這種行業(yè)標(biāo)準(zhǔn)化的制定,也是他們的任務(wù)之一。他們的下一個(gè)目標(biāo),是到2028年,把智源院做成全球公認(rèn)的頂尖人工智能研究機(jī)構(gòu)。
AI火了之后,很多城市都想做AI之城。大家的招數(shù)往往都是招來了多少家企業(yè),收攏了多少人才,發(fā)表了多少篇論文,有多少產(chǎn)值。然而北京早就脫離了這種范疇:
他們更愿意把工作做到看不見的地方去。
不管是資助基礎(chǔ)理論研究,領(lǐng)先企業(yè)追趕科技前沿,分享成果、經(jīng)驗(yàn)、人才,還是最后站在行業(yè)角度進(jìn)行標(biāo)準(zhǔn)化。
這些工作很低調(diào),就像智源院之于公眾一樣。
除了為,還要有所不為。今年5月,北京下發(fā)《促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,其中著重提到:
包容審慎的監(jiān)管環(huán)境。
有數(shù)據(jù)顯示,我國60%的人工智能核心人才都在北京,接近30%的人工智能核心企業(yè)在北京。國家網(wǎng)信辦審批備案的通用大模型里,北京排全國第一。事實(shí)上,相關(guān)管理辦法出臺(tái)以后,領(lǐng)先全國,最快完成備案上線的,也是這些來自北京的大模型。
你看,一雙鞋子到底合不合腳,大家穿一穿總能知道。