如果您問您日常使用的智能手機語音助手是否害怕ChatGPT,您通常不會收到有趣或信息豐富的答案。那么這是一個問題嗎?
自然語言處理 (NLP) 是人工智能研究的一個領(lǐng)域,它催生了語音助手和語言翻譯等實際應用,但現(xiàn)在似乎受到了大型語言模型 (LLM)(例如 OpenAI 的 GPT-4)的威脅。最近在 r/Machinelearning Reddit 上發(fā)表的一篇文章總結(jié)了這種情緒,詢問其他人是否“目睹了大型科技公司 NLP 組織內(nèi)部的恐慌?”
弗吉尼亞大學計算機科學助理教授Yangfeng Ji在學者和學生中觀察到類似的困擾,并且最近試圖通過指出LLM 不適合的 NLP 研究領(lǐng)域來平息這些恐懼。“就算不是恐慌,至少也可以說是復雜的心情,”Ji說。
研究人員擔心LLM的未知數(shù)。
Ji 相信研究人員有能力在新方法出現(xiàn)時采用新方法,但OpenAI最近 LLM 模型的成功給這項工作帶來了麻煩。LLM能夠完成許多任務,但最成功的LLM都是閉門造車。OpenAI 沒有詳細說明 GPT-4 的功能,這是 OpenAI 最近的 LLM 模型,開發(fā)人員只能通過 API 訪問它。
“就個人而言,更糟糕的是我們甚至不知道它是否只是一個語言模型,”Ji 說。他指出,LLM 支持的聊天機器人,如 ChatGPT、Bing Chat 和Google Bard,產(chǎn)生的結(jié)果超越了 LLM。他們似乎會隨著時間的推移更新自己的能力并從互聯(lián)網(wǎng)上獲取新數(shù)據(jù)(通常盡管模型聲稱,當被問到時,它缺乏這種能力)。人工智能模型通常需要訓練才能對新數(shù)據(jù)采取行動?!暗?,如果它是一個以 LLM 作為核心組件的軟件系統(tǒng),那么這些問題就很容易解決,”Ji 說。
來自 OpenAI 和谷歌的 LLM 的不透明性讓研究人員陷入困境。這些模型在許多任務上明顯優(yōu)于過去的 NLP 研究,但外界只能猜測它們是如何實現(xiàn)這一目標的。Ji 將此描述為閉源模型和開源模型之間的“神秘的性能差距”。
盡管如此,Ji 還是看到了 LLM 能力之外的大量 NLP 研究空間。他指出LLM如何繼續(xù)與道德問題作斗爭,使他們不適合某些組織。它們也很難微調(diào),并且會產(chǎn)生意想不到的結(jié)果。這些問題在用于集思廣益蛋糕食譜或給朋友寫電子郵件時不太可能造成傷害,但“當人們開始認真對待這些系統(tǒng)并使用它們進行實際工作時,它們就會成為主要障礙。”
Siri已死,Siri 萬歲!
LLM的迅速崛起不僅僅是學術(shù)上的。Apple、Microsoft 和Amazon向各自的語音助手投資了數(shù)十億美元,每家都承諾提供智能、語音激活的助手,這些助手將成長為有用的伙伴。努力沒有得到回報。亞馬遜最近幾輪裁員包括對 Alexa 團隊的大幅裁員,據(jù)報道,該團隊在 2022 年損失了 100 億美元。微軟首席執(zhí)行官薩蒂亞納德拉最近稱語音助手“像石頭一樣愚蠢”,而 Cortana 幾乎被拋棄了。據(jù)報道,谷歌智能助理團隊正在重組以協(xié)助巴德。只有 Apple 的 Siri 經(jīng)久不衰,盡管近年來的改進已經(jīng)放緩至涓涓細流。
正如研究人員對 LLM 的力量措手不及一樣,科技公司也對其廣泛的應用毫無準備。由 LLM 支持的聊天機器人,如 ChatGPT、Google Bard 和 Bing Chat,可以完成語音助手無法完成的任務(比如從頭開始編寫電子郵件),并且使用比預設語音更逼真、更引人入勝的語言來完成這些任務助理提供。
Pragmatic AI Labs 的創(chuàng)始人 Noah Gift認為這是一個根本性的轉(zhuǎn)變?!岸嗄陙?,數(shù)據(jù)科學的重點一直是調(diào)整超參數(shù)、清理數(shù)據(jù),以及主要關(guān)注研究和技術(shù)與商業(yè)價值的對比,Stack Overflow 等網(wǎng)站就證明了這一點,”Gift 說?!霸谖易罱鼘懙囊槐緯鳳ractical MLOps中,我預測數(shù)據(jù)科學會越來越少,而大型組織構(gòu)建的模型會越來越多,這在很大程度上正在發(fā)生。如果你在一家從事 NLP 工作但尚未投入生產(chǎn)的公司工作,那么是的,你可能非常擔心你的工作不再重要了?!?/p>
但是暫時不要刻 Siri 的墓碑。NLP 研究仍然很重要,即使實施它的策略在不斷發(fā)展。
微軟快速轉(zhuǎn)向人工智能就是一個例子。該公司與 OpenAI 的合作促成了多項 GPT 支持的產(chǎn)品發(fā)布,包括 Github Copilot、Bing Chat 和 Microsoft 365 Copilot。微軟還沒有宣布新的語音助手,但第三方開發(fā)商已經(jīng)引入了瀏覽器插件,將這一功能硬塞進了 ChatGPT。OpenAI 正式發(fā)布的 ChatGPT 插件已經(jīng)限量發(fā)布,很可能會為定制語音助手打開閘門——等等。
“我根本不相信語音是死胡同,事實上,隨著新的 LLM 進入消費產(chǎn)品領(lǐng)域,它會得到顯著改善,”Gift 說?!白畛跽Z音的關(guān)鍵問題可能是這些項目根本不如 OpenAI 和其他新興 LLM 技術(shù)提供商使用的技術(shù)。我看到文本和語音 LLM 的使用為他們的技術(shù)創(chuàng)造了巨大的市場?!?/p>