首位“AI軟件工程師”亮相引爆科技圈
【科技創(chuàng)新世界潮】(317)
◎記者 張夢(mèng)然
一家成立不到兩個(gè)月但擁有十名天才工程師的初創(chuàng)公司Cognition,搞了一個(gè)引爆科技圈的大動(dòng)作。
他們推出了一款名為Devin的人工智能(AI)助手,可以協(xié)助人類(lèi)軟件工程師完成諸多開(kāi)發(fā)任務(wù)。Devin不同于現(xiàn)有其他AI編碼者,它可以從零構(gòu)建網(wǎng)站、自行部署應(yīng)用、修復(fù)漏洞、學(xué)習(xí)新技術(shù)等,人類(lèi)只需扮演一個(gè)下指令和監(jiān)督的角色。
這是第一個(gè)真正意義上完全自主的AI軟件工程師,一亮相即掀起軒然大波,因?yàn)槿藗儞?dān)心:人類(lèi)程序員是不是真要失業(yè)了?
測(cè)試表現(xiàn)超越“同輩”
據(jù)Cognition官網(wǎng)報(bào)道,Devin只需一句指令,即可端到端地處理整個(gè)開(kāi)發(fā)項(xiàng)目。
按照用戶需求,Devin可以同時(shí)執(zhí)行多步驟工作流程,人類(lèi)工程師則可以實(shí)時(shí)觀察其進(jìn)度,發(fā)現(xiàn)錯(cuò)誤時(shí),跳出指令進(jìn)行修正。這便于工程師們將大部分工作“外包”給AI,自己則可以潛心于創(chuàng)意性工作。
在SWE-bench基準(zhǔn)測(cè)試中,Devin的表現(xiàn)遠(yuǎn)超Claude 2、Llama、GPT-4等選手,能夠完整正確地處理13.86%的問(wèn)題。相較之下,GPT-4只能處理1.74%的問(wèn)題。更重要的是,Devin在測(cè)試中沒(méi)有得到任何幫助,而其他所有模型都需要幫助,即人們要準(zhǔn)確告知模型需要編輯哪些文件。
這一進(jìn)展,標(biāo)志著AI在自主理解和解決軟件開(kāi)發(fā)問(wèn)題方面取得了顯著進(jìn)步。目前,Devin已經(jīng)成功通過(guò)一家AI公司面試,并且在Upwork上完成了實(shí)際工作。
運(yùn)作幾乎完全自主
Devin的厲害之處,還在于可以規(guī)劃和執(zhí)行異常復(fù)雜的工程任務(wù),這類(lèi)任務(wù)通常需要數(shù)千個(gè)決策才能完成。在這之中,無(wú)論進(jìn)行到任何一步,它都可以回調(diào)所有相關(guān)的上下文信息,保證任務(wù)的邏輯性,也便于隨時(shí)校正。
更讓人震撼的是,Devin不僅能幫人們解決代碼,還囊括了與之相關(guān)的整個(gè)工作流。
譬如,當(dāng)工程師需要設(shè)計(jì)一個(gè)網(wǎng)頁(yè)游戲時(shí),Devin首先能生成網(wǎng)頁(yè),接著還能完成服務(wù)端的部署,最后直接發(fā)布上線,省去了中間大量人工操作。甚至在發(fā)現(xiàn)漏洞之后,Devin還會(huì)回溯報(bào)錯(cuò)出現(xiàn)的位置及對(duì)應(yīng)的數(shù)據(jù),然后分析原因并給出解決方案。
此外,作為一個(gè)AI全能助手,Devin還可以幫助人類(lèi)訓(xùn)練和微調(diào)其他AI。對(duì)于一些常見(jiàn)的模型,你只需要提及模型的名稱(chēng),Devin自己就知道要怎樣去訓(xùn)練。
那人們需要做什么呢?按設(shè)想,最終的Devin會(huì)讓人類(lèi)只需要發(fā)號(hào)施令,其他什么也不用做。
對(duì)軟件開(kāi)發(fā)業(yè)影響深遠(yuǎn)
初創(chuàng)公司Cognition雖然只有十名員工,但他們手中卻握著十塊IOI(國(guó)際信息學(xué)奧林匹克競(jìng)賽)金牌,核心創(chuàng)始團(tuán)隊(duì)為3名華人。
Devin現(xiàn)處于內(nèi)測(cè)階段,有意用戶可申請(qǐng)?zhí)崆霸囉?。目前,團(tuán)隊(duì)尚未透露更多核心技術(shù)細(xì)節(jié),但他們表示,Devin源于其長(zhǎng)期推理及規(guī)劃研究的進(jìn)展。編碼只是第一步,這一AI助手其實(shí)可推廣到更寬領(lǐng)域。
Devin的出現(xiàn),可能對(duì)軟件開(kāi)發(fā)行業(yè)產(chǎn)生深遠(yuǎn)影響,甚至可能減少對(duì)人類(lèi)開(kāi)發(fā)者的需求。但須注意到,該技術(shù)仍處于早期階段,其成熟度和效果需要業(yè)界作進(jìn)一步評(píng)估。
就目前而言,Devin的成功可以說(shuō)為當(dāng)今軟件開(kāi)發(fā)人員帶來(lái)更新更好的AI協(xié)作體驗(yàn)。人們從繁瑣工作中“解放”,只需監(jiān)督AI系統(tǒng)去處理,而自己將精力投入到創(chuàng)新性任務(wù)上,實(shí)現(xiàn)生產(chǎn)力的真正提高。
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 推動(dòng)高水平安全的數(shù)據(jù)跨境流動(dòng) 促進(jìn)數(shù)字貿(mào)易高質(zhì)量發(fā)展
- 加快以數(shù)字化驅(qū)動(dòng)國(guó)際消費(fèi)中心城市建設(shè)
- 【這些暖心故事 】原來(lái)自己叫況旺生!
- 評(píng)彈傳承的重點(diǎn)應(yīng)是傳統(tǒng)書(shū)目的整理提升
- 提升非遺系統(tǒng)性保護(hù)水平
- 傳統(tǒng)非遺“龍” 舞出新氣韻
- 中老鐵路呈現(xiàn)客貨兩旺態(tài)勢(shì)
- 北京外貿(mào)實(shí)現(xiàn)“開(kāi)門(mén)紅”
- 在戈壁灘創(chuàng)造綠色奇跡——記兵團(tuán)第六師五家渠市紅旗農(nóng)場(chǎng)三連退休職工馬獻(xiàn)民
- 復(fù)旦博醫(yī)團(tuán):踏遍青山為仁心