国产小视频免费观看,中文国产成人精品久久一区,91香蕉黄

全球首個(gè)AI程序員誕生，碼農(nóng)飯碗一夜被砸！

新智元

2024-03-13 16:18:04

全球首位AI軟件工程師Devin誕生了，它掌握全棧技能，云端部署、底層代碼、改bug、訓(xùn)練和微調(diào)AI模型都不在話下。最可怕的是，它完全不怕996，老黃的預(yù)言是徹底成真了！

就在剛剛，世界上第一位AI程序員Devin誕生。

一家叫Cognition的10人初創(chuàng)公司，才成立不到2個(gè)月，就給了全世界億點(diǎn)點(diǎn)震撼。

剛一放出，Devin就刷爆了全網(wǎng)。

它掌握了全棧技能，能自主學(xué)習(xí)不熟悉的技術(shù)，端到端地構(gòu)建和部署應(yīng)用程序，自己改bug，甚至還能訓(xùn)練和微調(diào)自己的AI模型！

在SWE-bench上，它的表現(xiàn)遠(yuǎn)遠(yuǎn)超過Claude 2、Llama、GPT-4等選手，取得了13.86%的驚人成績(jī)！

也就是說(shuō)，它已經(jīng)能通過AI公司的面試了。

就在前不久，英偉達(dá)CEO黃仁勛表示，自己相信就在不久的將來(lái)，人類再也不需要學(xué)習(xí)如何編碼了，孩子們應(yīng)該停止編程課。

誰(shuí)能想到，才短短數(shù)月，他的預(yù)言就成真了！

更令人震驚的是，Devin背后擁有一支強(qiáng)大的金牌程序員團(tuán)隊(duì)（規(guī)模不大，人才濟(jì)濟(jì)）。

據(jù)介紹，僅創(chuàng)始團(tuán)隊(duì)已經(jīng)狂攬了10個(gè)IOI金牌！

首席執(zhí)行官Scott Wu和弟弟Neal Wu獲獎(jiǎng)情況

Cognition AI的首席執(zhí)行官Scott Wu稱，自己從9歲開始學(xué)習(xí)編程，便愛上了將想法變成現(xiàn)實(shí)的能力?，F(xiàn)在，這個(gè)夢(mèng)想居然真的實(shí)現(xiàn)了。

網(wǎng)友驚呼：碼農(nóng)不存在了??？

看到Devin如此無(wú)敵的能力，網(wǎng)友驚呼，一切都完結(jié)了！

Devin會(huì)搶走我的飯碗嗎？

德?lián)銩I之父，OpenAI的研究科學(xué)家Noam Brown表示，「2024年將是人工智能令人興奮的一年」。

計(jì)算機(jī)科學(xué)家，AI創(chuàng)業(yè)公司CEOSilas Alberti評(píng)價(jià)到：

它是一個(gè)能夠獨(dú)立完成任務(wù)的自主系統(tǒng)，在快速原型設(shè)計(jì)、修復(fù)bugs和復(fù)雜數(shù)據(jù)的可視化上表現(xiàn)卓越。

大部分其他助手在進(jìn)行四五步操作后就會(huì)偏離任務(wù)軌道，但Devin能夠在整個(gè)任務(wù)過程中準(zhǔn)確地保持它的目標(biāo)和方向不變。

投資了Cognition AI的硅谷大佬Peter Thiel更是認(rèn)為，Cognition AI與Founders Fund之前投資過的DeepMind，現(xiàn)在的AI巨型獨(dú)角獸OpenAI，Scale AI等公司處于同一水平。

AI初創(chuàng)公司Unify創(chuàng)始人稱，Devin不僅搶走了我的工作，還搶走了我的名字，簡(jiǎn)直是雪上加霜。

美國(guó)著名開發(fā)者Brian Roemmele表示，自主編碼智能體Devin已現(xiàn)AGI雛形！它能在幾分鐘內(nèi)自主編寫整個(gè)應(yīng)用程序。這是真正無(wú)代碼未來(lái)的開始。

Spotify工程師表示：「目前尚不清楚智能體會(huì)在幾年內(nèi)取代軟件開發(fā)人員，但免費(fèi)午餐已經(jīng)不復(fù)存在?！?/p>

「從為期8周的訓(xùn)練營(yíng)畢業(yè)，然后找到一份價(jià)值 20 萬(wàn)美元的工作，這樣的日子已經(jīng)一去不復(fù)返了。做好磨練和深入學(xué)習(xí)的準(zhǔn)備。熟練地引導(dǎo)人工智能取得好的結(jié)果可能才是未來(lái)程序員能體現(xiàn)出來(lái)的價(jià)值。」

世界首位AI軟件工程師Devin

AI軟件工程師Devin的影響力，簡(jiǎn)直堪比2023年全網(wǎng)炸鍋的智能體——AutoGPT。

Devin究竟有多強(qiáng)大？

Devin可以規(guī)劃和執(zhí)行需要數(shù)千項(xiàng)決策的復(fù)雜工程任務(wù)。

并且，它可以在每一步回憶相關(guān)的上下文，隨著時(shí)間的推移學(xué)習(xí)，并糾正錯(cuò)誤。

研究人員還為Devin提供了常見的開發(fā)工具，包括shell、代碼編輯器、以及瀏覽器——皆是人類完成任務(wù)最需要的工具。

此外，Devin還具備主動(dòng)與用戶協(xié)作的能力。

比如，實(shí)時(shí)報(bào)告進(jìn)度，接受反饋，并根據(jù)需要與你一起完成設(shè)計(jì)選擇。

目前，Cognition AI還推出了一個(gè)Devin定制的Chrome插件——Tab Switcher。

而Cognition的開發(fā)者們紛紛分享出了自己使用Devin的示例，簡(jiǎn)直不要太驚艷！

學(xué)習(xí)如何使用陌生的技術(shù)

當(dāng)你發(fā)給Devin一篇博文后，它會(huì)在幾分鐘內(nèi)完成自主學(xué)習(xí)，從閱讀文章，運(yùn)行代碼。

可以看到，Devin在Modal上運(yùn)行了ControlNet，在寫代碼過程中，還會(huì)自我debug。

最后，人類程序員Sara想要帶有自己名字的桌面壁紙，就立刻生成了。

構(gòu)建和部署端到端的應(yīng)用程序

當(dāng)你想要玩一個(gè)「生命游戲」（the Game of Life），交給Devin做就好了。

Devin首先會(huì)用工具Shell，創(chuàng)建一個(gè)新的react應(yīng)用程序，然后開始通過編輯器編寫代碼。

代碼完成后，它還會(huì)將應(yīng)用自動(dòng)部署到Netlify，一個(gè)初步的「生命游戲」就做好了。

這個(gè)過程中，Devin還可以逐一根據(jù)用戶請(qǐng)求，完成功能的添加。

比如在初始屏幕上加上像素化的「Devin」一詞，然后希望這個(gè)字體再大一些，幀速率更快。

與此同時(shí)，人類程序員要求Devin修復(fù)一個(gè)bug——屏幕在3秒后凍結(jié)的錯(cuò)誤。

下一步，讓Devin在10秒后提高幀速率，讓網(wǎng)站能適應(yīng)不同的窗口大小。

同時(shí)，一個(gè)游戲還得需要交互性，即在某處點(diǎn)擊鼠標(biāo)時(shí)，應(yīng)該生成一個(gè)新塊。

接下來(lái)，就是見證奇跡的時(shí)刻了！

自行查找代碼庫(kù)錯(cuò)誤，自行修復(fù)

這個(gè)名叫Andrew的開發(fā)者表示，自己維護(hù)了一個(gè)大型開源存儲(chǔ)庫(kù)，其中包含許多不同的算法，用于競(jìng)爭(zhēng)性編程。

不久前有朋友告訴他：其中一個(gè)實(shí)現(xiàn)中有bug。Andrew插入了一個(gè)快速修復(fù)，但并沒有測(cè)試它，因?yàn)闆]能抽出時(shí)間來(lái)編寫測(cè)試用例。

既然如此，就給Devin來(lái)試試看！

小哥給了Devin存儲(chǔ)庫(kù)，讓它來(lái)檢查和處理這個(gè)存儲(chǔ)庫(kù)。然后，Devin就找到了正確的存儲(chǔ)庫(kù)，檢查了所有文件。

接下來(lái)，在小哥的要求下，Devin還很輕易地就把測(cè)試寫了出來(lái)——只是看了一下測(cè)試應(yīng)該是什么樣，接口是什么樣，就完成了這項(xiàng)任務(wù)。

挑戰(zhàn)還沒完，接下來(lái)，小哥要求Devin將對(duì)所有輸入進(jìn)行測(cè)試，而不僅僅是測(cè)試這個(gè)輸入，也就是自己常用的「暴力測(cè)試」。

于是，Devin重寫了測(cè)試函數(shù)，使用了四個(gè)嵌套的循環(huán)，這一次，它發(fā)現(xiàn)了一個(gè)bug。

接著，Devin開始調(diào)試。它在這里添加了一個(gè)print語(yǔ)句，來(lái)調(diào)試輸入和輸出，然后重新測(cè)試，發(fā)現(xiàn)了錯(cuò)誤：代碼不應(yīng)該返回負(fù)值。

于是Devin查看了正在測(cè)試的代碼，然后添加進(jìn)了這行代碼，確保返回值是非負(fù)的。

現(xiàn)在Andrew可以確信，自己的代碼是完全正確的了！

訓(xùn)練和微調(diào)AI模型

Devin能力也在一步一步進(jìn)階。

最讓人興奮的是，它可以自己訓(xùn)練、微調(diào)模型，AI訓(xùn)AI成真了！

首先，給智能體Devin提供一個(gè)GitHub庫(kù)的鏈接（比如QLoRA——一種量化大模型的微調(diào)方法)。

Devin所做的就是，微調(diào)7B Llama模型。

接下來(lái)，就是獻(xiàn)技的時(shí)刻，Devin克隆了GitHub庫(kù)，了解如何使用readme運(yùn)行，設(shè)置好所需pip的要求，查看所有的腳本語(yǔ)言，并開始運(yùn)行。

訓(xùn)練過程中，Devin還遇到了Cuda問題（這是在開源庫(kù)中可以預(yù)料到的）。

不過這可難不倒Devin。它會(huì)自主查看英偉達(dá)環(huán)境，并找出如何重新安裝軟件包讓其成功運(yùn)行。

接下來(lái)，模型訓(xùn)練開始進(jìn)行了。

可以看到損失率正在下降，程序員給出Devin正向反饋：「做的不錯(cuò)」！

大約1小時(shí)后，Devin已經(jīng)順利完成幾百步訓(xùn)練，仍在進(jìn)行中...

解決開源代碼庫(kù)中的錯(cuò)誤和功能請(qǐng)求

只要給出一個(gè)指向GitHub問題的鏈接，Devin就會(huì)執(zhí)行所需的所有設(shè)置和上下文收集了！

這位叫Tony的工程師，想一次運(yùn)行一堆命令，并且希望在一個(gè)屏幕上跟蹤它們的狀態(tài)，于是他找到了一個(gè)名為impro的開源工具，希望執(zhí)行這個(gè)操作。

看起來(lái)雖然impro完成了任務(wù)，但狀態(tài)太模糊了。根本看不出來(lái)究竟哪些命令失敗了。

Tony想改進(jìn)這里的用戶體驗(yàn)，但是自己根本不熟悉代碼，于是他想到去求助Devin。

他發(fā)現(xiàn)網(wǎng)上有人面臨同樣的問題，所以他把這個(gè)問題的鏈接給了Devin，讓它修復(fù)這個(gè)問題。

在右邊，他很清晰地看到，Devin從一個(gè)工具跳轉(zhuǎn)到了另一個(gè)工具。

它首先使用了Shell Deon CLS存儲(chǔ)庫(kù)，然后閱讀了自述文件和編輯器，了解了子代碼，然后，它返回Shell，安裝了所需要的依賴項(xiàng)。另外，Devin還打開了一個(gè)Web瀏覽器。

然后，Devin就開始編碼了！

在這個(gè)過程中，它甚至打開了一些R文檔來(lái)調(diào)試編譯器錯(cuò)誤。最后，完成了任務(wù)，出了一份自己做了哪些改進(jìn)的總結(jié)報(bào)告。

所以，Devin的更改有效嗎？Tony發(fā)現(xiàn)，它成功了！第三個(gè)命令是成功的，他甚至可以看到狀態(tài)碼。

為成熟的生產(chǎn)存儲(chǔ)庫(kù)做貢獻(xiàn)，修復(fù)系統(tǒng)錯(cuò)誤

下面這個(gè)示例，是SWE-BENCH基準(zhǔn)測(cè)試的一部分。Devin解決了Python代數(shù)系統(tǒng)中的一個(gè)錯(cuò)誤。它會(huì)自行設(shè)置代碼環(huán)境、復(fù)制錯(cuò)誤、自行編碼、測(cè)試修復(fù)程序！

這位叫Neil的開發(fā)者，分享了Devin幫自己改bug的示例。

他一直在用這個(gè)名為Senpai的存儲(chǔ)庫(kù)，它是一個(gè)用Python編寫的代數(shù)系統(tǒng)。

但Neil發(fā)現(xiàn)，取分?jǐn)?shù)的對(duì)數(shù)時(shí)，我們會(huì)得到一個(gè)無(wú)窮大的Zoo，這是絕對(duì)不可能的。

于是，他試著讓Devin來(lái)解決這個(gè)問題。

Devin在存儲(chǔ)庫(kù)中復(fù)現(xiàn)了Zoo的問題后，隨后，它找出了代碼中正確的那部分，添加了print語(yǔ)句，以便找出問題原因。

可以看到，原因就在于，整數(shù)除法會(huì)得到0，就導(dǎo)致之前取了0的對(duì)數(shù)。因此，Devin用true除法替代了整數(shù)除法。

隨后，它開始測(cè)試，確保沒有其他問題。

就這樣，Devin幫Neil節(jié)省了大量的時(shí)間。

勝任自由職業(yè)平臺(tái)Upwork的工作

Cognition的開發(fā)者You還試著在全球最大的綜合類自由職業(yè)平臺(tái)Upwork上，為Devin提供真正的工作。

沒想到，它竟可以完全勝任，看來(lái)智能體也能出來(lái)做副業(yè)了......

在Upwork上，他首先挑選了一個(gè)「用計(jì)算機(jī)視覺模型做推理」的工作。

先來(lái)看看這個(gè)任務(wù)的要求：

- 我希望利用該資源庫(kù)中的模型進(jìn)行推斷。（https://github.com/mahdi65/roadDamageDetection2020）

- 你的交付成果將是關(guān)于如何在AWS的EC2實(shí)例中進(jìn)行操作的詳細(xì)說(shuō)明。

- 請(qǐng)?zhí)峁┠阃瓿蛇@項(xiàng)工作的評(píng)估報(bào)告。我不會(huì)回復(fù)沒有評(píng)估的報(bào)告。

看起來(lái)很簡(jiǎn)單一個(gè)任務(wù)，但開發(fā)者You表示，自己也不知道如何開始做。

但是交給Devin，這件事就變得容易得多了。

Devin收到請(qǐng)求后，先開始設(shè)置了存儲(chǔ)庫(kù)。然后運(yùn)行中發(fā)現(xiàn)了版本控制問題，Devin自主處理并更新了代碼。

然后，Devin繼續(xù)加載并導(dǎo)入軟件包。它還從互聯(lián)網(wǎng)上下載了圖像，并運(yùn)行模型。

接下來(lái)，Devin再次遇到了問題——關(guān)于打印調(diào)試，它自主修復(fù)了代碼。

最后，Devin對(duì)數(shù)據(jù)結(jié)果進(jìn)行抽樣，并編寫出一份報(bào)告。

它會(huì)一些標(biāo)有損壞道路樣本的圖像，以及詳細(xì)的text文檔。

13.86%正確率，Devin碾壓GPT-4/Cluade 3

SWE-bench是一個(gè)要求AI智能體解決開源項(xiàng)目（例如Django和scikit-learn）中實(shí)際GitHub問題的測(cè)試。

在評(píng)估中，Devin能夠完整地正確處理13.86%的問題，這一成績(jī)大幅領(lǐng)先于之前技術(shù)水平的1.96%。

即便是在提供了具體需要修改的文件情況下，先前最優(yōu)秀的模型也僅能處理4.80%的問題。

華人金牌程序員團(tuán)隊(duì)

Cognition AI這家正在改變世界的公司，才正式成立不到2個(gè)月，僅有10名員工，分散在紐約、硅谷，以及世界各地的Airbnb民宿中。

就這樣一個(gè)連正式辦公場(chǎng)地都沒有的團(tuán)隊(duì)，卻已經(jīng)從硅谷大佬Peter Thiel領(lǐng)投的Funders Fund和其他知名的投資機(jī)構(gòu)那里獲得了2100萬(wàn)美元的投資，其中還包括前推特高管Elad Gil。

在如此炸裂的產(chǎn)品的背后，團(tuán)隊(duì)成員背景更是奪目耀眼。

Cognition AI的核心創(chuàng)始團(tuán)隊(duì)包括3人：CEO Scott Wu，CTO Steven Hao，CPO Walden Yan。

聯(lián)合創(chuàng)始人兼首席技術(shù)官Steven Hao ，在AI系統(tǒng)方面有著豐富經(jīng)驗(yàn)，

他于2018年本科畢業(yè)于MIT計(jì)算機(jī)和數(shù)學(xué)專業(yè)。

2018年加入由Alexandr Wang創(chuàng)辦的Scale AI，是一名資深的AI系統(tǒng)工程師。

聯(lián)合創(chuàng)始人兼首席產(chǎn)品官Walden Yan ，在加入Cognition AI之前他還是哈佛大學(xué)的一名在校大學(xué)生。

作為計(jì)算機(jī)和經(jīng)濟(jì)專業(yè)本科大四在讀的學(xué)生，理論上應(yīng)該今年本科畢業(yè)。

但實(shí)際情況卻處在「保密狀態(tài)」，因?yàn)樗€沒有告訴父母自己輟學(xué)的事情。（手動(dòng)狗頭）

他在個(gè)人網(wǎng)站上，列出了3個(gè)自己認(rèn)為最為重要的成就：

- 是MIT PRIMES Research團(tuán)隊(duì)的成員

- 得過IOI金牌

- 創(chuàng)立DeepReason并開發(fā)了一款智能區(qū)塊鏈審計(jì)工具

聯(lián)合創(chuàng)始人兼首席執(zhí)行官Scott Wu ，是一名連續(xù)創(chuàng)業(yè)者。

在成立Cognition之前，他曾經(jīng)創(chuàng)立了一個(gè)用AI驅(qū)動(dòng)的社交網(wǎng)絡(luò)平臺(tái)Lunchclub，并且也曾就讀于哈佛大學(xué)。

他的弟弟Neal Wu ，也是公司的員工。

在加入Cognition AI之前也在包括谷歌等多家公司工作過，是一名經(jīng)驗(yàn)豐富的軟件工程師和銷售。

本科同樣畢業(yè)于哈佛大學(xué)計(jì)算機(jī)專業(yè)。

他們兄弟倆在非常青年時(shí)期就參加了很多國(guó)際編程比賽和科學(xué)奧賽，獲獎(jiǎng)無(wú)數(shù)。

不僅如此，團(tuán)隊(duì)的其他成員，也都是大佬級(jí)的存在。

還有一個(gè)nobody。

其中，Andrew He從6年級(jí)開始，參加了各種數(shù)學(xué)競(jìng)賽。在2014年和2015年的國(guó)際信息學(xué)奧林匹克大賽上獲得了2枚金牌。

他就讀于MIT，并于2019年畢業(yè)，獲得了數(shù)學(xué)和計(jì)算機(jī)科學(xué)學(xué)士學(xué)位。

如此豐富的編程競(jìng)賽經(jīng)歷，對(duì)于他們開發(fā)這個(gè)編程AI智能體有著非常大的幫助。

眾所周知，編程競(jìng)賽的核心就是要迅速準(zhǔn)確地解決編程難題，強(qiáng)調(diào)快速解決復(fù)雜問題的能力，而且對(duì)于創(chuàng)新的解決問題的思路有著很高的要求。

在CEO Scott Wu看來(lái)，團(tuán)隊(duì)獨(dú)特的背景讓他們?cè)谶@個(gè)領(lǐng)域有非常強(qiáng)大的優(yōu)勢(shì)。

將AI培養(yǎng)成程序員，實(shí)際上是一個(gè)復(fù)雜的算法挑戰(zhàn)，這需要AI系統(tǒng)能夠做出復(fù)雜的決策，并能預(yù)見未來(lái)幾步，從而選擇正確的路徑。

這幾乎就是我們多年來(lái)一直在大腦進(jìn)行的一場(chǎng)場(chǎng)比賽。現(xiàn)在，我們需要用AI系統(tǒng)來(lái)參加這些比賽。

Cognition AI首款產(chǎn)品Devin的最大突破在于大大提升計(jì)算機(jī)推理和規(guī)劃能力。

它要求AI系統(tǒng)不僅要預(yù)測(cè)句子中的下一個(gè)詞或代碼行的下一個(gè)片段，還能像人類一樣進(jìn)行思考，獲得解決最終問題最為合理的方法和路徑。

而行業(yè)共識(shí)也認(rèn)為，AI的推理和規(guī)劃能力將是AI下一步產(chǎn)生最重要突破最有可能的方向。

Devin在接受用戶用自然語(yǔ)言提出的任務(wù)之后，不僅能夠自主開始工作并完成任務(wù)，還會(huì)向用戶報(bào)告其計(jì)劃，并實(shí)時(shí)展示正在使用的命令和代碼。

如果用戶發(fā)現(xiàn)過程中的問題，可以即時(shí)提供反饋。它會(huì)在任務(wù)進(jìn)行中立即調(diào)整。

而Devin最大的亮點(diǎn)在于，大多數(shù)現(xiàn)有的AI系統(tǒng)在處理這類長(zhǎng)期任務(wù)時(shí)往往難以保持一致性和專注，但它能夠在完成數(shù)百上千任務(wù)時(shí)始終不偏離目標(biāo)。

其他計(jì)算機(jī)科學(xué)家或者資深程序員在試用過Devin之后認(rèn)為，它已經(jīng)不僅僅是一個(gè)編程助手，簡(jiǎn)直是一個(gè)可以獨(dú)立工作的員工。

CEO Wu并沒有詳細(xì)說(shuō)明他們的智能體背后使用的AI技術(shù)，只是籠統(tǒng)地解釋說(shuō)，團(tuán)隊(duì)找到了將大語(yǔ)言模型（例如OpenAI的GPT-4）與強(qiáng)化學(xué)習(xí)技術(shù)相結(jié)合的獨(dú)特方法。

上一篇：榮耀稱已投入100億用于AI研發(fā)

下一篇：OpenAI機(jī)器人炸裂登場(chǎng)！ChatGPT 終于有身體了，能說(shuō)會(huì)看還能做家務(wù)

香蕉在线视频网站,国产视频综合,亚洲综合五月天欧美,成人亚洲综合,日本欧美高清全视频,国产视频黄色,欧美高清在线播放