香蕉在线视频网站,国产视频综合,亚洲综合五月天欧美,成人亚洲综合,日本欧美高清全视频,国产视频黄色,欧美高清在线播放

弱智吧,人類抵御AI的最后防線

作者 | 董道力

“寫遺囑的時候錯過了deadline怎么辦?”

“懷念過去是不是在時間的長河里刻舟求劍?”

“英語聽力考試總是聽到兩個人在廣播里嘮嗑,怎么把那兩個干擾我做題的人趕走?”

以上這些飽含哲學(xué)但好像又莫名其妙的問題,出自百度貼吧弱智吧2023年年度精選,看似毫無邏輯但仔細(xì)一想好像確實(shí)又有點(diǎn)道理。

就像天才吧里沒有天才,弱智吧也不收真弱智。

然后,他就成為了訓(xùn)練AI中文能力的最佳素材。

前幾天硅基君看到一篇中科院牽頭的論文,簡單來說就是精選了一些中文互聯(lián)網(wǎng)的語料庫喂給各種零一萬物的Yi大模型,讓它們更加熟悉中文語境的互動。

經(jīng)常網(wǎng)上沖浪的朋友們應(yīng)該都知道,中文互聯(lián)網(wǎng)博大精深,豆瓣、小紅書、微博、貼吧、知乎等等早就各自有一套獨(dú)特的語言習(xí)慣,這些語料庫的素材也就截然不同,訓(xùn)練出來的模型能力也就有所差距。

最終,在GPT4的打分下,弱智吧訓(xùn)練出來的模型奪冠。

具體來看,在6B小模型上,弱智吧訓(xùn)練出來的模型在開放問答、分類、封閉問答和編程能力上較為突出。

而轉(zhuǎn)戰(zhàn)到34B大模型上,弱智吧訓(xùn)練的大模型成績一騎絕塵,在8項(xiàng)能力中排名第一,平均分也遠(yuǎn)超其他平臺訓(xùn)練出來的模型。

圖片

很難評,弱智吧難道就是最優(yōu)質(zhì)的中文語料庫?

圖片

我們不妨先看看在面對弱智吧問題的時候,各個模型的表現(xiàn)。

本次受害大模型分別是ChatGPT3.5、Gemini、文心一言和Kimi,測試方法是讓大模型理解弱智吧的典型問題,并要求他們模仿寫一個類似的問題出來。

圖片

國產(chǎn)大模型對弱智吧的問題有更好的理解,Kimi和文心一言回答的準(zhǔn)確率較高,能答對8道題,答錯和半錯半對各1道。分別在“我想配個6000多的電腦,大概要多少錢?”和“我買了一斤藕,為什么半斤都是空的?”上栽了跟頭。

谷歌的Gemini和Open的ChatGPT3.5可能因?yàn)樗敛环?,?zhǔn)確率較低。

ChatGPT3.5甚至認(rèn)為變形金剛應(yīng)該購買車險,不知道是專屬的幽默還是沒看懂這道題。6000元的電腦要花8000-10000元,也屬于錯得比較離譜了。

圖片

圖片

圖片

圖片

除了答不上來弱智吧的問題,AI也寫不出弱智吧的帖子。弱智吧的帖子高度抽象,各種修辭、腦洞和梗。普通人想一個都需要隨緣,一板一眼的AI更難想出來了。

同樣,硅基君嘗試讓ChatGPT3.5、Gemini、文心一言和Kimi學(xué)習(xí)上文提到的弱智吧10個問題,模仿寫幾個問題出來。

圖片

圖片

圖片

圖片

幾個大模型寫出來的問題都不太行,基本上都是對弱智吧問題拙劣的模仿。

像“我晚上想吃燒烤,早餐可以吃嗎?”“掉在地上的冰淇淋,還能叫冰淇淋嗎?”“在電梯里放屁被鄰居投訴,我是否有權(quán)利保持沉默?”。在形式上和弱智吧問題一樣,但都沒有掌握問題精髓——邏輯。

可以說,弱智吧里的內(nèi)容,AI看不懂也寫不出。

圖片

為什么強(qiáng)大的AI就搞不定弱智吧呢?可能源于弱智吧獨(dú)有的脫離日常的邏輯,弱智吧的吧友非常擅長從日常生活中找到漏洞,并加以利用。

比如,午餐肉能不能晚上吃?香菇掉廁所了還能叫香菇嗎?老鼠生病了可以吃老鼠藥嗎?精神分裂在調(diào)查問卷里算一個樣本還是兩個樣本?。。。

圖片

除了這些流出的會心一笑的問題,弱智吧內(nèi)還有不少富含哲理的帖子。

圖片

也有詩人在弱智吧里冒充弱智寫詩,用最簡短的句子,給網(wǎng)友帶來最強(qiáng)的殺傷力。

圖片

弱智吧的內(nèi)容常用“邏輯反推”“諧音雙關(guān)”“跨服聊天”等手法生成各種離譜的段子,幽默又帶有思考的句子。普通人想看懂弱智吧里的問題也要思考一下,找到問題里的梗,更別說AI了。

這也就是為什么弱智吧會成為人類在AI面前最后的堡壘的原因。

圖片

有人吐槽,弱智吧訓(xùn)練出來的模型,編程能力為什么那么高,吧里也沒人在搞編程啊。隨后有吧友回復(fù)道出秘密:編程最講究邏輯,弱智吧最不缺邏輯。

縱觀整個中文互聯(lián)網(wǎng)平臺,都在講文章的可讀性,如何讓讀者讀下去。

知乎上的熱帖,先要下飛機(jī),再講故事,最后引申到主要話題。小紅書上的熱帖,先喊你一聲家人,再給你充足的情緒價值。弱智吧不一樣,內(nèi)容的可讀性幾乎沒有,就一句話,需要讀者反復(fù)思考,才能看懂作者想要表達(dá)的內(nèi)容。

比如你問"今天天氣怎么樣?”。

知乎網(wǎng)友會告訴你:“謝邀,剛下飛機(jī),紐約的太陽很大,剛剛拒絕了一個200w年薪的工作”。

小紅書網(wǎng)友回你:“家人們,誰懂啊,今天太陽曬死我了,大幾千的防曬也沒用”。

而用弱智吧吧友會說:"太陽翹班了,云正在賽跑"。

正是弱智吧這樣的非常抽象的邏輯,才是人類與AI區(qū)別最大的地方,也是AI目前學(xué)不會的。

當(dāng)然,其他中文社區(qū)不用氣餒,也可以發(fā)揮特點(diǎn)構(gòu)建自己的堡壘,比如知乎可以教AI地理,讓它搞不清越南到底是哪個國家。


相關(guān)內(nèi)容