無論是出于驚嘆還是吐槽,開年至今應該沒有什么能比ChatGPT更吸引網(wǎng)友關(guān)注了。
在這之前大部分普通人對人工智能的印象,可能還停留在2016年 AlphaGo 和李世石九段那場世紀對決。在此之后,雖然名義上我們已經(jīng)通過短視頻推薦、導航路線規(guī)劃等場景接觸過人工智能,但其實始終缺乏實感。
而ChatGPT的出現(xiàn)不僅讓人們“直接與AI接觸”,甚至可以用來寫論文、打代碼、回郵件、甚至面試。從學生到打工人,不僅是信任AI,而是忙于讓AI為自己服務了。
實際上,ChatGPT在通用語義領域有著如此高的水準,若將同源技術(shù)在垂直領域進行訓練與積累,其背后的商業(yè)價值,與對產(chǎn)業(yè)的影響,或許將從現(xiàn)在記為一個元年,改變一個時代的產(chǎn)業(yè)形態(tài)。
從作弊到輔導的技術(shù)嬗變
根據(jù)紐約時報報道,一月份北密歇根大學的哲學教授安東尼·奧曼Antony Aumann在為他的世界宗教課程批改論文時,讀到了他所說的“班上最好的論文”:段落干凈、用例恰當、邏輯嚴謹?shù)赜懻摗恫伎ń睢返牡赖滦浴?/p>
不出意料,后來在詢問中學生承認,這篇內(nèi)容是由 ChatGPT 完成的。
事實上,ChatGPT給美國教育界帶來的刺激是不小的。全美范圍內(nèi),許多大學教授都在重新設計課程,更多地采用口試、小組合作和手寫文章作為評估方式,而不是讓學生家庭作業(yè)式地提交文章。
但對ChatGPT嚴防死守的同時,這樣的故事隱約透露著一個更重要的真相——由于 ChatGPT 在語義理解、信息整理、模仿能力上都有不俗實力,從某些角度來講,這個人工智能產(chǎn)品無疑稱得上是個優(yōu)等生。換句話說,ChatGPT 除了可以扮演學生槍手,更可以扮演學生的輔導老師,針對問題輔導學生功課,以及幫助學校的教師備課出題。
同樣是在美國,有的老師開始在課程中讓學生和 ChatGPT 辯論,以訓練邏輯能力;有的老師用 ChatGPT 出題,提高備課效率;還有的老師用其快速搜索整理資料,提高課程豐富度。
借著熱度,很多教育企業(yè)也紛紛發(fā)布了自己的產(chǎn)品或計劃。
網(wǎng)易有道AI技術(shù)團隊正投入到ChatGPT同源技術(shù)在教育場景的落地研發(fā)中。此前有道已經(jīng)在AI口語老師、中文作文批改等細分學習場景中嘗試應用;科大訊飛官宣今年5月將發(fā)布AI學習機;而好未來也在推出的學而思學習機上上線AI講題機器人小π。
ChatGPT 的出現(xiàn),可能是教育走向更好狀態(tài)的契機。
中式教育,如何找到自己的答案
根據(jù)2019年統(tǒng)計,中國小學凈入學率99.95%,初中100%,高中88.8%。這樣的教育普及成績在14億的人口基數(shù)下,全球罕見。但另一邊,中國整體教育完成“量變”轉(zhuǎn)向“質(zhì)變”,依然是一條需要探索的道路:
宏觀的層面來說,偏遠地區(qū)的教育資源依然需要外部支援、大城市的家長在爭取優(yōu)質(zhì)的學區(qū)資源。具體到生活中,家長每天還要查看家長群通知、緊盯孩子寫作業(yè);老師們除了上課,每天還要布置作業(yè)和無止盡地發(fā)消息@家長,下課后,老師們還得批改作業(yè)、備課、排課。這種內(nèi)耗式的師、生、家長關(guān)系,幾乎是整個中國教育下的同病相憐,無比熟悉、無處可逃、每天無限循環(huán)。
這些問題的根源,都來自教育資源與精力的分配依然是不平衡的。比如,老師明明應該花更多時間在孩子身上,但布置批改作業(yè)、備課這些機械、重復的事情卻占用了大量時間;為了彌補老師失去的輔導時間,家長好不容易下班了還要撿起快忘干凈的知識點指導孩子功課;不同地區(qū)的發(fā)展差異短時間是很難彌補的,優(yōu)秀的教師數(shù)量往往也就只有那些。如果不能讓優(yōu)秀的教育資源普惠,那么這些問題都很難得到解決。
其實,教育行業(yè)一直都有著很好融入人工智能的基礎:
首先是“資源”:教育領域具有大量的可被歸納的數(shù)據(jù)和資源,這些數(shù)據(jù)可以被AI技術(shù)進行深入分析和挖掘,幫助教師和學生更好地理解和應對學習難點。
其次是“場景”,教育領域的應用場景相對集中,比如改作文、打分、講解等,可以針對特定的教育場景進行AI技術(shù)的應用。這樣做可以避免AI技術(shù)的泛化問題,讓AI技術(shù)更加垂直貼近實際需求,提高應用效果和用戶體驗。
最后是“受眾”,教育領域?qū)τ贏I技術(shù)的接受度較高,教育工作者普遍具有較高的文化素養(yǎng)和技術(shù)素養(yǎng),這使得他們更加容易理解和應用AI技術(shù),推動AI技術(shù)在教育領域的落地。
這也是為什么在ChatGPT走紅以后,“教育領域可能是ChatGPT最容易落地的場景”成為國內(nèi)行業(yè)熱議的話題:當ChatGPT這樣的產(chǎn)品,可以低成本地被每個家庭的孩子訪問和使用,那么每個學生都相當于獲得了一位輔導老師,這對于整個行業(yè)生產(chǎn)力的解放將是不可估量的。
但AI+教育,并不是一個簡單的1+1問題。
“雖然我們在討論人工智能技術(shù),但是僅人工智能技術(shù)本身是做不出一個產(chǎn)品的。傳統(tǒng)的機器已經(jīng)無法承載深度學習時代的巨大計算量的需求,知識獲取(訓練)和提供服務本身都依賴巨大的算力?!?/p>
網(wǎng)易有道總裁金磊曾表示,跟業(yè)務場景結(jié)合的技術(shù)才能真的解決用戶問題。這不僅涉及到對模型的不斷訓練,還需要對模型壓縮、蒸餾、量化等多項相關(guān)技術(shù)的持續(xù)探索,以及針對硬件設備的深度優(yōu)化。只有讓其達到了應用的門檻,并且能夠產(chǎn)生商業(yè)價值以后,一大批垂直領域的優(yōu)化定制需求大量涌現(xiàn),
“如何實現(xiàn)低成本的模型定制,也成為算法和算力側(cè)都需要關(guān)注的重要問題?!彼f。
隱形玩家的方法論
如何把人工智能技術(shù)融入教育,需要想很多辦法。我們可以從行業(yè)中不同企業(yè)的業(yè)務模式中,看到一些共性。
針對資源,需要構(gòu)建起知識圖譜,覆蓋學習各場景沉淀數(shù)據(jù)。比如學而思多年來所積累的內(nèi)容資源,為學習機內(nèi)置了超1000萬分鐘的優(yōu)質(zhì)學而思自研課程,課程內(nèi)容100%由原學而思老師講授;有道積累了基于K12的知識圖譜、智能批改系統(tǒng)、學情大數(shù)據(jù)、自適應學習、個性化課程、口語評測、自動答題系統(tǒng)等解決方案。
針對場景,很多垂直領域的探索,比如口語練習、作文批改、英文寫作、在學術(shù)側(cè)也做了很多的縱深。雖然模型沒有ChatGPT那么大,但是在細分場景下有著更好的表現(xiàn)。比如有道推出了有道寫作,根據(jù)不同課程的需要,開發(fā)了批改、優(yōu)化、潤色和打分的能力;阿里和訊飛都曾推出針對閱卷場景的人工智能,減輕閱卷老師壓力。
針對受眾人群,要通過恰當?shù)闹悄苡布O備,通過AI+硬件+內(nèi)容的綜合能力,低門檻使用的同時,建立起符合學生、老師使用場景需求的產(chǎn)品。代表性的就是各家的詞典筆、學習機、還有智能臺燈。
這一系列策略,林林總總,其實就一個思想:將技術(shù)集中投入到教育行業(yè)與人工智能相性比較好的垂直領域,避免技術(shù)停留在實驗室中,讓它更容易落地。
網(wǎng)易有道總裁金磊曾表示,跟業(yè)務場景結(jié)合的技術(shù)才能真的解決用戶問題。這不僅涉及到對模型的不斷訓練,還需要對模型壓縮、蒸餾、量化等多項相關(guān)技術(shù)的持續(xù)探索,以及針對硬件設備的深度優(yōu)化。只有讓其達到了應用的門檻,并且能夠產(chǎn)生商業(yè)價值以后,一大批垂直領域的優(yōu)化定制需求才會大量涌現(xiàn)。
“如何實現(xiàn)低成本的模型定制,是成為算法和算力側(cè)都需要關(guān)注的重要問題。”他說。
一個比較有討論價值的例子,是有道的爆款產(chǎn)品詞典筆。
從功能點來看,這支筆可以實現(xiàn)文字掃描、拼圖、識別、機器翻譯、語音合成、語音識別,并做到離線精準翻譯。將這些功能落地到一支小小的筆頭上,這背后需要的是大量的算法模型,考驗的更是技術(shù)在端側(cè)的落地能力。
眾所周知,端側(cè)的技術(shù)難度是如何在資源有限的硬件環(huán)境里滿足業(yè)務對性能的要求。無論是存儲、內(nèi)存,或者計算資源都比較有限,對AI模型必然提出了更高的要求,并且是一個極為難啃的硬骨頭。有道不僅做到了技術(shù)在業(yè)務場景中的落地,還不斷刷新了詞典筆這一細分品類的天花板。實現(xiàn)了在查詞過程中的交互、點查、掃描翻譯、一目十行等功能點上的創(chuàng)新。
事實上,無論是有道深耕多年的智能學習硬件,還是訊飛植入各類產(chǎn)品的語音技術(shù),都是自然語言處理相關(guān)技術(shù)的一個領域。也正是基于此,他們才在做到了業(yè)界相對領先的自然語言處理能力的同時,能夠深入教育行業(yè),并做到持續(xù)引領。
當然,如果只有自然語言處理能力的話,即使訓練出來很好的模型也只能支持文本的能力。所以有道有著圖像識別、人臉識別、語音合成、OCR等基礎技術(shù)。這種多維度的補充,給AI帶來了能“看”能“聽”的體驗,通過更全面地感知世界,誕生出更符合用戶的使用直覺與需求的產(chǎn)品。
這也是為什么在ChatGPT走紅后,有道能夠快速做出應對的深層原因。
而技術(shù)上的堅持,最終將反映在經(jīng)營狀況,最新一季的財報數(shù)據(jù)顯示,網(wǎng)易有道2022年Q4凈收入達14.5億元,同比增長38.6%。其中,學習服務、智能硬件以及在線營銷服務三大業(yè)務板塊第四季度同比分別增長39.2%、28.1%、58.6%。最終2022全年,有道實現(xiàn)凈收入50.1億元,同比增長24.8%。——在“人工智能的精工細作”時代,持續(xù)多年的投入逐漸有了回報。
收入變化的背后,研發(fā)、資本開支是著眼于未來的投資:2020、2021、2022年有道研發(fā)費用分別為3.7億元、6.1億元、8億元。增長主要來自于對智能硬件在內(nèi)的業(yè)務研發(fā)投入的增加。
四季度,學習服務凈收入為8.1億元。有道特別披露了學習服務中數(shù)字內(nèi)容服務的銷售額為超6億元,并已連續(xù)兩個季度實現(xiàn)凈收入可覆蓋成本及運營支出。數(shù)字內(nèi)容的本質(zhì)仍然離不開對于AI技術(shù)的依托。內(nèi)容收入作為典型的長尾收入類型,隨著時間推移將會持續(xù)創(chuàng)造價值。
每一個新技術(shù)都有自己的成長周期。在近兩年這種高度不確定的環(huán)境中,大家都在追求穩(wěn)妥收縮,長期主義的投入更需要戰(zhàn)略定力。無論是中國的AI還是教育,國家長遠發(fā)展的兩種戰(zhàn)略支撐,離不開最為本質(zhì)的底層驅(qū)動力科技企業(yè)的自立自強。
這也是在ChatGPT爆火、被熱議的今天,在兩個行業(yè)中留下的不起眼的注腳。