在近日公布的全球自然語言處理領域頂級測試GLUE中,京東探索研究院聯(lián)合悉尼大學、武漢大學以及北京航空航天大學組成夢之隊(JDExplore Dream Team, d-team)參與其中,其提出的織女模型Vega v1以總平均分91.3分榮登榜首奪冠,再次刷新自然語言理解技術世界紀錄,超越同場競技的微軟、Facebook、斯坦福大學等企業(yè)和高校團隊。
值得提及的是,測試中織女模型在九個子任務中的四個單項任務,即情感分類任務SST-2(The Stanford Sentiment Treebank)、語義相似度任務MRPC (Microsoft Research Paraphrase Corpus)、問句語義等價任務QQP(The Quora Question Pairs)和指代消解任務WNLI(winograd NLI)中均位列第一。尤其在情感分析任務SST 和指代消解任務WNLI 中首次超越人類智能水平,充分證明了京東探索研究院自然語言處理技術水平在超級深度學習領域的全球領先地位。
據(jù)了解,本次奪冠的織女模型Vega v1采用了“預訓練-微調”范式,依托于多個重要預訓練的技術創(chuàng)新實現(xiàn)突破,例如采用了高效節(jié)能的并行化訓練框架以及數(shù)據(jù)利用方法,使用了數(shù)十億參數(shù)量的創(chuàng)新模型架構、更好的自監(jiān)督信號以及多粒度句子級表征等。據(jù)介紹,未來還將考慮融合可信人工智能等技術對織女模型進行全面升級,讓其不僅具有強大的文本理解能力,還能具備穩(wěn)定性、可解釋性、保護隱私、公平性等重要屬性。
京東探索研究院在自然語言處理及機器視覺等領域擁有世界領先的智能人機交互技術,在國際頂級學術會議上發(fā)表了520余篇論文,斬獲了33項國際AI比賽冠軍并多次獲得國際大獎,且擁有370余項專利。依托京東優(yōu)質的應用場景,打造了新一代多模態(tài)智能客服產品,涵蓋了全鏈條客戶服務場景。
值得肯定的是,織女Vega v1模型問鼎GLUE榜單并超越人類的表現(xiàn),將京東探索研究院NLP模型水平推上新臺階,有望以創(chuàng)新性科技更好助動智能城市、供應鏈管理、智能零售等應用研究,更快推進數(shù)智化產業(yè)蓬勃發(fā)展。