訂閱
糾錯
加入自媒體

巨頭狂卷代碼大模型

2024-04-12 09:28
雷科技
關(guān)注

讓AI寫(xiě)代碼正在越來(lái)越流行。今天螞蟻集團智能研發(fā)平臺CodeFuse推出了“圖生代碼”技術(shù),這一技術(shù)集成在CodeFuse上,可將網(wǎng)頁(yè)、App等設計圖一鍵轉化成前端代碼。不只是螞蟻,阿里云、百度、360、OpenAI、微軟、GitHub、Google等科技巨頭均在持續加碼代碼大模型,探索AI“自編程”。

看似高度專(zhuān)業(yè)且極具創(chuàng )造性的編程儼然已成大模型落地的核心領(lǐng)域之一,這聽(tīng)著(zhù)就好像“機器人制造機器人”一樣酷。既然如此,“編程”本身將會(huì )被AI如何改變呢?

巨頭狂卷代碼大模型,

自然語(yǔ)言編程是終極目標

互聯(lián)網(wǎng)時(shí)代,包括比爾蓋茨、喬布斯在內的大佬都曾鼓勵人人都要學(xué)會(huì )編程,特別是兒童。然而前段時(shí)間,AI大佬、英偉達CEO黃仁勛卻在對孩子的寄語(yǔ)中稱(chēng),“生成式AI的發(fā)展大幅降低了學(xué)習編程的重要性。”而英偉達的工作,“就是創(chuàng )造計算技術(shù),讓所有人都不需要編程。”

不過(guò)黃仁勛并沒(méi)有否定編程本身的價(jià)值,只是他認為AI可以讓每個(gè)人都能編程:“編程語(yǔ)言可以普及成為人類(lèi)的語(yǔ)言,現在世界上每個(gè)人都是程序員。這就是人工智能的奇跡。”

有了計算機就有了編程的概念。編程語(yǔ)言一直在進(jìn)化,從最初的二進(jìn)制,到后來(lái)的機器代碼,到匯編語(yǔ)言,再到高級語(yǔ)言。這些年,高級語(yǔ)言也在不斷革新。而編程語(yǔ)言不斷進(jìn)階的目的,就是為了讓編程難度更低、效率更高。按照這樣的路線(xiàn)來(lái)看,人人都掌握的自然語(yǔ)言將是“編程語(yǔ)言”進(jìn)化的終極形態(tài)。

圖片

(常見(jiàn)編程語(yǔ)言)

不過(guò),這就跟無(wú)人駕駛一樣:L5自動(dòng)駕駛終究只是理想,當下智能汽車(chē)上商用的卻都是L3級輔助駕駛。短期內,“完全自然語(yǔ)言編程”不可能成為現實(shí)。但隨著(zhù)AI大模型的發(fā)展,AI在編程以及研發(fā)中正在發(fā)揮日益重要的作用,科技巨頭無(wú)不在戰略布局,實(shí)現更加自動(dòng)化的研發(fā)模式。

2020年,OpenAI推出了擁有1.75萬(wàn)億參數、取得重大突破的GPT-3。21年,OpenAI基于GPT-3模型開(kāi)發(fā)了成功破圈的ChatGPT,與此同時(shí)也創(chuàng )建了Codex系統,其可根據程序員的自然語(yǔ)言輸入進(jìn)行簡(jiǎn)單的代碼編寫(xiě)支持,這是AI編程的起點(diǎn)。

Codex的出現,讓IT研發(fā)界大為震撼:AI可將程序員從重復、繁重、繁瑣以及機械的編程工作中解放出來(lái),讓他們專(zhuān)注于創(chuàng )造產(chǎn)品本身。正因為此,在A(yíng)I與研發(fā)軟件領(lǐng)域均有建樹(shù)的巨頭,如Google、微軟、阿里云、螞蟻、百度、360、華為均競相研發(fā)并推出代碼大模型。

微軟推出了OpenAI Dall-E驅動(dòng)的圖片設計工具,在低代碼應用開(kāi)發(fā)軟件Power Apps中推出了支持GPT-3的工具,并根據OpenAI的Codex模型開(kāi)發(fā)了一款代碼建議工具GitHub Copilot。

圖片

(OpenAI CodeX)

Google在推出PaLM Coder代碼大模型的同時(shí),于23年與新晉AI編程獨角獸 Replit合作,將其人工智能語(yǔ)言模型和Replit的生成式代碼工具Ghostwriter結合。

Replit由Facebook前軟件工程師Amjad Masad創(chuàng )辦,在打造全球最大的在線(xiàn)IDE(集成開(kāi)發(fā)環(huán)境)后,于2022年11月基于A(yíng)I大模型技術(shù)推出Ghostwriter,對標 GitHub Copilot,擁有代碼自動(dòng)生成和補全、進(jìn)行代碼語(yǔ)言轉換、支持代碼解釋和搜索等。

中國科技巨頭不遑多讓。2022年華為推出代碼大模型Pangu-Coder;23年百度智能云推出“Comate”代碼助手,第一階段的主要功能是“輔助代碼撰寫(xiě)”,此后將在特定領(lǐng)域場(chǎng)景實(shí)現自然語(yǔ)言代碼生成,第三階段將實(shí)現全領(lǐng)域的自然語(yǔ)言開(kāi)發(fā);同一年,螞蟻“百靈大模型家族”迎來(lái)了代碼大模型成員CodeFuse,其源自于螞蟻?身的開(kāi)發(fā)場(chǎng)景及代碼庫沉淀,基于海量?質(zhì)量代碼數據和代碼領(lǐng)域特?詞表,和多任務(wù)微調技術(shù)MFT,在螞蟻?萬(wàn)多內部研發(fā)?員的?常編碼、測試、運維等場(chǎng)景中,經(jīng)過(guò)反復驗證與迭代。去年中,CodeFuse 及其必要的?具鏈,?向技術(shù)社區開(kāi)源開(kāi)放;10月,CodeFuse推出IDE插件功能,支持多種語(yǔ)言和編程工具。

圖片

(螞蟻CodeFuse)

24年,代碼大模型呈現出百花齊放的態(tài)勢。在螞蟻CodeFuse推出“圖生代碼”的同一時(shí)期,阿里云迎來(lái)了1號AI員工“通義靈碼”的上線(xiàn),其“簡(jiǎn)歷”顯示這是一個(gè)出生于0101世界、無(wú)性別的硅基生命,人格屬于INTJ,職位是AI智能編碼助手,項目經(jīng)歷是“截至2023年4月,下載量超過(guò)200萬(wàn),每天數百萬(wàn)行代碼被程序員采用。”在4月中旬即將召開(kāi)的百度Create2024大會(huì )上,李彥宏也將發(fā)布AI編程相關(guān)產(chǎn)品更新。

巨頭狂卷大模型,而代碼大模型更是成了兵家必爭之地。

跟一日千里的GPT一樣,21年到現在代碼大模型正在快速升級。在A(yíng)I編程上,從最初的行級代碼補全,升級到倉庫級代碼生成,再進(jìn)化到自然語(yǔ)言描述下的代碼生成。在代碼生成外,演進(jìn)出代碼語(yǔ)言轉換、代碼解釋和搜索、軟件文檔撰寫(xiě)、智能編程助理等功能,甚至出現了螞蟻提出的“AI賦能全生命周期研發(fā)”這樣的新的研發(fā)范式。

AI編程讓程序員專(zhuān)注于創(chuàng )造,

助力企業(yè)研發(fā)降本增效

編程AI化是計算進(jìn)化的必然。在通用計算體系下,摩爾定律早已失效。但讓人始料未及的是,“摩爾定律”卻在A(yíng)I計算體系中得以延續。Open AI CEO、ChatGPT之父Sam Altman指出,每年LLM參數規模大小增長(cháng)10X,人工智能運算量每隔18個(gè)月翻一番,這被稱(chēng)為“AI摩爾定律”。在A(yíng)I軟件內涵突變之時(shí),低效的傳統研發(fā)模式難以為繼,研發(fā)模式的奇點(diǎn)也已到來(lái)。

圖片

(AI摩爾定律)

AI如何改變研發(fā)本身成為業(yè)界關(guān)注的新焦點(diǎn)。紅杉資本則認為,生成式AI將逐漸改變各個(gè)行業(yè),但軟件開(kāi)發(fā)模式的轉型還沒(méi)完成。紅杉提出了“開(kāi)發(fā)工具2.0”,指出這種“Beyond Copilot”的新形態(tài),尚未被定義。

AI大模型率先改變的都是創(chuàng )造性職業(yè),比如文字、圖片、視頻、音樂(lè )等內容的創(chuàng )作均迎來(lái)了各自的現象級應用:ChatGPT、Midjourney、Sora、Suno。如今,AI對創(chuàng )造的賦能來(lái)到了編程領(lǐng)域,AI編程將是AI大模型技術(shù)的下一個(gè)“殺手锏場(chǎng)景”。

對科技巨頭來(lái)說(shuō),布局AI編程,既是內在研發(fā)提效的剛需,也是布局新興業(yè)務(wù)的必要——這跟云計算、to B數字科技“始于內、發(fā)于外”的歷程一致。

首先,通用大模型要落地離不開(kāi)“垂直大模型”這一橋梁,而編程則是大模型最有潛力的垂直應用場(chǎng)景,大模型與軟件開(kāi)發(fā)工具結合可顯著(zhù)解決技術(shù)人員面臨的痛點(diǎn)。

最早大規模引入AI編程的GitHub平臺曾在一篇調研文章中探討了GitHub Copilot對程序員效率和幸福感的提升,發(fā)現使用工具的程序員完成任務(wù)速度快55%,96%的使用者認為自己處理重復性的工作更快了,88%的使用者認為自己可以更加專(zhuān)注于更喜歡的工作上。

百度、阿里云、螞蟻等布局代碼大模型的國內巨頭,也是先嘗到了甜頭。比如在螞蟻內部,CodeFuse ?持40多種編程語(yǔ)?,10多個(gè)主流IDE平臺,現在有超過(guò)五成的程序員使用CodeFuse,在這些程序員寫(xiě)的代碼里,AI生成代碼占比超過(guò)了10%,整體采納率30%,在生成單元測試場(chǎng)景采納率可達到 60%。以最新發(fā)布的“圖生代碼”技術(shù)為例,前端工程師在還原一個(gè)中型網(wǎng)頁(yè)時(shí),如果最終有200 行代碼,一人耗時(shí)約需1小時(shí),使用CodeFuse一鍵生成后,只需檢查與調整,這大幅提高了前端工程師的效率。

圖片

(CodeFuse正在成為越來(lái)越多程序員的編程工具)

其次,編程人員群體龐大,研發(fā)提效是科技巨頭高質(zhì)量增長(cháng)的關(guān)鍵一環(huán)。

以中國為例,來(lái)自Boss直聘的《2023年中國程序員人才發(fā)展報告》顯示,中國程序員總數約為600萬(wàn)人左右。如果算上需求分析師、設計師、UI/UE/UX、產(chǎn)品經(jīng)理、IT運維等研發(fā)上下游工種,IT研發(fā)人才群體更加龐大。

大量的研發(fā)人才意味著(zhù)龐大的研發(fā)支出,這從頭部互聯(lián)網(wǎng)企業(yè)的研發(fā)成本可以窺見(jiàn),李彥宏日前表示,百度這么多年研發(fā)費用占到收入的比重一直是20%以上,以23年1345.98億元營(yíng)收計算,研發(fā)投入在270億左右。阿里、騰訊、字節、華為等巨頭的研發(fā)投入規模更大,且相當部分均在軟件研發(fā)上。

哪怕代碼大模型可提高1%的研發(fā)效率(當然,從實(shí)踐來(lái)看提效遠不止1%),對科技巨頭降本增效也有非凡意義——高質(zhì)量增長(cháng)是科技行業(yè)的主旋律,降本增效是每家公司的重點(diǎn)。正因為此,所有科技企業(yè)都將推動(dòng)所有軟件工程師使用AI編程工具。

最后,程序員以及研發(fā)人員具有更強的“AI基礎素養”,更樂(lè )意利用、更可能用好AI編程輔助工具。

對于非技術(shù)類(lèi)人員來(lái)說(shuō),即便是使用ChatGPT這樣的大眾化工具,也需要學(xué)習“Prompt(提示詞)”等技能,可見(jiàn)真正使用AI大模型來(lái)創(chuàng )作對大多數人來(lái)說(shuō)是有門(mén)檻的,且普通人無(wú)法適應當前大模型技術(shù)結果的不確定性、不可靠。

對技術(shù)人才來(lái)說(shuō),以上問(wèn)題不存在,因為他們是最善于使用工具、也樂(lè )于探索新工具的人群。程序員是“終身學(xué)習職業(yè)”職業(yè),他們一直在學(xué)習更先進(jìn)的編程語(yǔ)言、尋覓更先進(jìn)的工具、應用最先進(jìn)的方法來(lái)提高工作效率與質(zhì)量。在代碼大模型驅動(dòng)下,AI編程工具如雨后春筍出現,對應的研發(fā)體系、協(xié)作流程、管理方法、設計模式都將劇變,就算企業(yè)不推動(dòng),研發(fā)人員也會(huì )自主去探索和學(xué)習AI研發(fā)工具。

圖片

(CodeFuse IDE插件的代碼生成功能(部分))

Gartner發(fā)布的2024年十大戰略技術(shù)趨勢也指出:到2028年,75%的企業(yè)軟件工程師將使用AI編程助手。放眼未來(lái),在助力企業(yè)研發(fā)板塊“降本增效”的同時(shí),代碼大模型將更大程度地解放技術(shù)人員,讓他們專(zhuān)注于更高維度的創(chuàng )造工作。

AI編程進(jìn)階:

從協(xié)助寫(xiě)代碼到重構研發(fā)范式

從當前的AI編程實(shí)踐來(lái)看,代碼大模型正沿著(zhù)兩個(gè)方向演進(jìn)。

一條路是不斷提高代碼生成能力,做好程序員編程智能輔助工具。代碼生成、補全、解釋與轉換能力,從行級到片段到倉庫級不斷進(jìn)化。在生成代碼時(shí),支持多輪對話(huà)式需求理解,支持自然語(yǔ)言、語(yǔ)音、圖生代碼等多模態(tài)指令理解,這也是包括GitHub Copilot在內的AI編程平臺在主攻的方向,它們基于云提供SaaS服務(wù)或插件工具,著(zhù)重于助力程序員提高代碼編寫(xiě)的效率和質(zhì)量。

另一條路則是讓AI滲透到研發(fā)的全生命周期,重構研發(fā)體系。

軟件開(kāi)發(fā)涉及到需求分析、編程開(kāi)發(fā)、測試與構建、發(fā)布與運維、數據洞察等鏈路。每一個(gè)鏈路都需要使用大量的專(zhuān)業(yè)工具,且與上下游研發(fā)鏈路進(jìn)行協(xié)作。理論上來(lái)說(shuō),所有研發(fā)工具都可以被AI重做一遍,軟件研發(fā)范式(包括工具鏈、協(xié)作流程、項目管理方法、設計模式等等)都將被重構。

在國內,螞蟻CodeFuse 是AI全?命周期研發(fā)的首倡者和積極探索者。在內部,螞蟻已將?模型技術(shù)應?在研發(fā)的全鏈路環(huán)節,在CodeFuse的版圖中,在需求階段,Project Copilot提供多場(chǎng)景開(kāi)發(fā)助手,提供需求/設計文檔智能生成等服務(wù);在開(kāi)發(fā)、測試、運維和數據環(huán)節,分別提供Code Copilot(IDE插件)、Test Copilot、Ops Copilot、Data Copilot等AI研發(fā)工具,大幅提高對應環(huán)節研發(fā)人員的工作效率。CodeFuse 在螞蟻內部被大規模應用在工業(yè)化生產(chǎn)場(chǎng)景,經(jīng)過(guò)反復驗證與迭代后再以開(kāi)發(fā)助手、IDE插件、AI Native IDE、Open API、開(kāi)源等形式開(kāi)放給行業(yè),同時(shí)也針對小程序開(kāi)發(fā)等特殊場(chǎng)景定制了AIGC方案。

圖片

(螞蟻CodeFuse探索AI全?命周期研發(fā)范式)

第二種路線(xiàn)可被簡(jiǎn)單地理解成企業(yè)研發(fā)的數智化升級,這將是科技類(lèi)企業(yè)數智能升級中不容忽視的一環(huán)。自動(dòng)駕駛技術(shù)不只是改變了車(chē)輛駕駛方式,也將重構出行、物流、道路、交管、法規等交通體系。同理,AI大模型不只是會(huì )提升程序員個(gè)體的工作效率,也將締造全新的研發(fā)范式。大部分的AI編程工具強調通用性,不大可能面向前端工程師提供“圖生代碼”這樣的細化服務(wù),因此目前更多是影響個(gè)人開(kāi)發(fā)者。但在A(yíng)I大模型重構研發(fā)體系時(shí),開(kāi)發(fā)團隊更需要去做全生命周期的AI研發(fā)的頂層布局,在每一個(gè)鏈路中使用AI研發(fā)工具且采取全新的協(xié)作模式、管理方法。

AI研發(fā)勢不可擋,

IT技術(shù)人員何去何從?

回到開(kāi)篇的問(wèn)題:編程到底會(huì )不會(huì )消亡?

看上去,隨著(zhù)AI編程技術(shù)的發(fā)展,人人都可用自然語(yǔ)言來(lái)編程,程序員確實(shí)將成為不復存在的職業(yè)。

但事實(shí)并非如此。

一方面,程序員的核心價(jià)值是“創(chuàng )造”,創(chuàng )造本身不可能被機器取代。自然語(yǔ)言編程只是降低了編程的“交互門(mén)檻”,但編程的根本是抽象思維、邏輯思維、系統思維、算法思維以及創(chuàng )造思維,特別是對物理世界的認知、理解與抽象,這些并非AI所長(cháng)。

另一方面,產(chǎn)品研發(fā)不只是編程。正如前文所言,研發(fā)涉及到需求分析等等環(huán)節,同時(shí)需要與產(chǎn)品運營(yíng)、市場(chǎng)推廣、商業(yè)化等環(huán)節密切配合,這些更是AI不可能做好的事情,比如AI就不可能洞察到用戶(hù)有在手機上收發(fā)紅包這樣的細微需求,更不可能做出網(wǎng)絡(luò )紅包這樣的創(chuàng )新產(chǎn)品——當然,有了AI編程工具,網(wǎng)絡(luò )紅包的開(kāi)發(fā)會(huì )更敏捷,更高效。螞蟻“2024支付寶五福節”的游戲中心項目代碼,就有30%由AI提交。

受過(guò)軟件開(kāi)發(fā)專(zhuān)業(yè)訓練的人都知道,編程不等于寫(xiě)代碼,項目管理、軟件測試、需求分析、算法、數據結構等等全鏈路研發(fā)技能也是所有計算機軟件類(lèi)專(zhuān)業(yè)的必修課。正因為此,技術(shù)人員要盡可能地用好AI編程工具提升個(gè)體工作效率,同時(shí)增強復合型能力,當重復性等工作大幅減少可用更多時(shí)間“創(chuàng )造”,強化用戶(hù)需求分析、創(chuàng )意設計、業(yè)務(wù)理解、項目管理等能力。

正如螞蟻集團CodeFuse負責人所言:“AI的普及不僅可以減少開(kāi)發(fā)人員的工作壓力,讓他們有更多精力投入到更有創(chuàng )造力的工作中去。”而AI研發(fā)范式的變革,并不代表“人”在研發(fā)場(chǎng)景的角色會(huì )消失,反而對AI和人如何協(xié)同提出了更高的要求。“AI目前主要集中在輔助編程(code copilot),編程要從copilot走向co-worker,甚至替代人,還有很多未解決的問(wèn)題,而整個(gè)研發(fā)生命周期的AI自動(dòng)化,還有很長(cháng)的路要走。”

AI不會(huì )取代任何舊的職業(yè),但會(huì )淘汰思維陳舊的人。長(cháng)期來(lái)看,AI將成為人類(lèi)的助手,?機協(xié)同是AI發(fā)展的終局,這一點(diǎn)會(huì )在研發(fā)特別是編程場(chǎng)景率先體現。對于企業(yè)來(lái)說(shuō),研發(fā)是根基,其本質(zhì)是用技術(shù)解決問(wèn)題和創(chuàng )造產(chǎn)品,這將是硅基文明基礎生產(chǎn)方式。2024年的一個(gè)顯著(zhù)趨勢是,編程以及研發(fā)本身,正在被AI大模型技術(shù)重構。所有技術(shù)人員必須擁抱AI研發(fā)的全新理念,適應新的研發(fā)協(xié)作模式。

是時(shí)候重新出發(fā)了。

       原文標題 : 巨頭狂卷代碼大模型

聲明: 本文由入駐維科號的作者撰寫(xiě),觀(guān)點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權或其他問(wèn)題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長(cháng)度6~500個(gè)字

您提交的評論過(guò)于頻繁,請輸入驗證碼繼續

暫無(wú)評論

暫無(wú)評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號