訂閱
糾錯
加入自媒體

巨頭狂卷代碼大模型

2024-04-12 09:28
雷科技
關注

讓AI寫代碼正在越來越流行。今天螞蟻集團智能研發(fā)平臺CodeFuse推出了“圖生代碼”技術,這一技術集成在CodeFuse上,可將網頁、App等設計圖一鍵轉化成前端代碼。不只是螞蟻,阿里云、百度、360、OpenAI、微軟、GitHub、Google等科技巨頭均在持續(xù)加碼代碼大模型,探索AI“自編程”。

看似高度專業(yè)且極具創(chuàng)造性的編程儼然已成大模型落地的核心領域之一,這聽著就好像“機器人制造機器人”一樣酷。既然如此,“編程”本身將會被AI如何改變呢?

巨頭狂卷代碼大模型,

自然語言編程是終極目標

互聯(lián)網時代,包括比爾蓋茨、喬布斯在內的大佬都曾鼓勵人人都要學會編程,特別是兒童。然而前段時間,AI大佬、英偉達CEO黃仁勛卻在對孩子的寄語中稱,“生成式AI的發(fā)展大幅降低了學習編程的重要性。”而英偉達的工作,“就是創(chuàng)造計算技術,讓所有人都不需要編程。”

不過黃仁勛并沒有否定編程本身的價值,只是他認為AI可以讓每個人都能編程:“編程語言可以普及成為人類的語言,現(xiàn)在世界上每個人都是程序員。這就是人工智能的奇跡。”

有了計算機就有了編程的概念。編程語言一直在進化,從最初的二進制,到后來的機器代碼,到匯編語言,再到高級語言。這些年,高級語言也在不斷革新。而編程語言不斷進階的目的,就是為了讓編程難度更低、效率更高。按照這樣的路線來看,人人都掌握的自然語言將是“編程語言”進化的終極形態(tài)。

圖片

(常見編程語言)

不過,這就跟無人駕駛一樣:L5自動駕駛終究只是理想,當下智能汽車上商用的卻都是L3級輔助駕駛。短期內,“完全自然語言編程”不可能成為現(xiàn)實。但隨著AI大模型的發(fā)展,AI在編程以及研發(fā)中正在發(fā)揮日益重要的作用,科技巨頭無不在戰(zhàn)略布局,實現(xiàn)更加自動化的研發(fā)模式。

2020年,OpenAI推出了擁有1.75萬億參數(shù)、取得重大突破的GPT-3。21年,OpenAI基于GPT-3模型開發(fā)了成功破圈的ChatGPT,與此同時也創(chuàng)建了Codex系統(tǒng),其可根據程序員的自然語言輸入進行簡單的代碼編寫支持,這是AI編程的起點。

Codex的出現(xiàn),讓IT研發(fā)界大為震撼:AI可將程序員從重復、繁重、繁瑣以及機械的編程工作中解放出來,讓他們專注于創(chuàng)造產品本身。正因為此,在AI與研發(fā)軟件領域均有建樹的巨頭,如Google、微軟、阿里云、螞蟻、百度、360、華為均競相研發(fā)并推出代碼大模型。

微軟推出了OpenAI Dall-E驅動的圖片設計工具,在低代碼應用開發(fā)軟件Power Apps中推出了支持GPT-3的工具,并根據OpenAI的Codex模型開發(fā)了一款代碼建議工具GitHub Copilot。

圖片

(OpenAI CodeX)

Google在推出PaLM Coder代碼大模型的同時,于23年與新晉AI編程獨角獸 Replit合作,將其人工智能語言模型和Replit的生成式代碼工具Ghostwriter結合。

Replit由Facebook前軟件工程師Amjad Masad創(chuàng)辦,在打造全球最大的在線IDE(集成開發(fā)環(huán)境)后,于2022年11月基于AI大模型技術推出Ghostwriter,對標 GitHub Copilot,擁有代碼自動生成和補全、進行代碼語言轉換、支持代碼解釋和搜索等。

中國科技巨頭不遑多讓。2022年華為推出代碼大模型Pangu-Coder;23年百度智能云推出“Comate”代碼助手,第一階段的主要功能是“輔助代碼撰寫”,此后將在特定領域場景實現(xiàn)自然語言代碼生成,第三階段將實現(xiàn)全領域的自然語言開發(fā);同一年,螞蟻“百靈大模型家族”迎來了代碼大模型成員CodeFuse,其源自于螞蟻?身的開發(fā)場景及代碼庫沉淀,基于海量?質量代碼數(shù)據和代碼領域特?詞表,和多任務微調技術MFT,在螞蟻?萬多內部研發(fā)?員的?常編碼、測試、運維等場景中,經過反復驗證與迭代。去年中,CodeFuse 及其必要的?具鏈,?向技術社區(qū)開源開放;10月,CodeFuse推出IDE插件功能,支持多種語言和編程工具。

圖片

(螞蟻CodeFuse)

24年,代碼大模型呈現(xiàn)出百花齊放的態(tài)勢。在螞蟻CodeFuse推出“圖生代碼”的同一時期,阿里云迎來了1號AI員工“通義靈碼”的上線,其“簡歷”顯示這是一個出生于0101世界、無性別的硅基生命,人格屬于INTJ,職位是AI智能編碼助手,項目經歷是“截至2023年4月,下載量超過200萬,每天數(shù)百萬行代碼被程序員采用。”在4月中旬即將召開的百度Create2024大會上,李彥宏也將發(fā)布AI編程相關產品更新。

巨頭狂卷大模型,而代碼大模型更是成了兵家必爭之地。

跟一日千里的GPT一樣,21年到現(xiàn)在代碼大模型正在快速升級。在AI編程上,從最初的行級代碼補全,升級到倉庫級代碼生成,再進化到自然語言描述下的代碼生成。在代碼生成外,演進出代碼語言轉換、代碼解釋和搜索、軟件文檔撰寫、智能編程助理等功能,甚至出現(xiàn)了螞蟻提出的“AI賦能全生命周期研發(fā)”這樣的新的研發(fā)范式。

AI編程讓程序員專注于創(chuàng)造,

助力企業(yè)研發(fā)降本增效

編程AI化是計算進化的必然。在通用計算體系下,摩爾定律早已失效。但讓人始料未及的是,“摩爾定律”卻在AI計算體系中得以延續(xù)。Open AI CEO、ChatGPT之父Sam Altman指出,每年LLM參數(shù)規(guī)模大小增長10X,人工智能運算量每隔18個月翻一番,這被稱為“AI摩爾定律”。在AI軟件內涵突變之時,低效的傳統(tǒng)研發(fā)模式難以為繼,研發(fā)模式的奇點也已到來。

圖片

(AI摩爾定律)

AI如何改變研發(fā)本身成為業(yè)界關注的新焦點。紅杉資本則認為,生成式AI將逐漸改變各個行業(yè),但軟件開發(fā)模式的轉型還沒完成。紅杉提出了“開發(fā)工具2.0”,指出這種“Beyond Copilot”的新形態(tài),尚未被定義。

AI大模型率先改變的都是創(chuàng)造性職業(yè),比如文字、圖片、視頻、音樂等內容的創(chuàng)作均迎來了各自的現(xiàn)象級應用:ChatGPT、Midjourney、Sora、Suno。如今,AI對創(chuàng)造的賦能來到了編程領域,AI編程將是AI大模型技術的下一個“殺手锏場景”。

對科技巨頭來說,布局AI編程,既是內在研發(fā)提效的剛需,也是布局新興業(yè)務的必要——這跟云計算、to B數(shù)字科技“始于內、發(fā)于外”的歷程一致。

首先,通用大模型要落地離不開“垂直大模型”這一橋梁,而編程則是大模型最有潛力的垂直應用場景,大模型與軟件開發(fā)工具結合可顯著解決技術人員面臨的痛點。

最早大規(guī)模引入AI編程的GitHub平臺曾在一篇調研文章中探討了GitHub Copilot對程序員效率和幸福感的提升,發(fā)現(xiàn)使用工具的程序員完成任務速度快55%,96%的使用者認為自己處理重復性的工作更快了,88%的使用者認為自己可以更加專注于更喜歡的工作上。

百度、阿里云、螞蟻等布局代碼大模型的國內巨頭,也是先嘗到了甜頭。比如在螞蟻內部,CodeFuse ?持40多種編程語?,10多個主流IDE平臺,現(xiàn)在有超過五成的程序員使用CodeFuse,在這些程序員寫的代碼里,AI生成代碼占比超過了10%,整體采納率30%,在生成單元測試場景采納率可達到 60%。以最新發(fā)布的“圖生代碼”技術為例,前端工程師在還原一個中型網頁時,如果最終有200 行代碼,一人耗時約需1小時,使用CodeFuse一鍵生成后,只需檢查與調整,這大幅提高了前端工程師的效率。

圖片

(CodeFuse正在成為越來越多程序員的編程工具)

其次,編程人員群體龐大,研發(fā)提效是科技巨頭高質量增長的關鍵一環(huán)。

以中國為例,來自Boss直聘的《2023年中國程序員人才發(fā)展報告》顯示,中國程序員總數(shù)約為600萬人左右。如果算上需求分析師、設計師、UI/UE/UX、產品經理、IT運維等研發(fā)上下游工種,IT研發(fā)人才群體更加龐大。

大量的研發(fā)人才意味著龐大的研發(fā)支出,這從頭部互聯(lián)網企業(yè)的研發(fā)成本可以窺見,李彥宏日前表示,百度這么多年研發(fā)費用占到收入的比重一直是20%以上,以23年1345.98億元營收計算,研發(fā)投入在270億左右。阿里、騰訊、字節(jié)、華為等巨頭的研發(fā)投入規(guī)模更大,且相當部分均在軟件研發(fā)上。

哪怕代碼大模型可提高1%的研發(fā)效率(當然,從實踐來看提效遠不止1%),對科技巨頭降本增效也有非凡意義——高質量增長是科技行業(yè)的主旋律,降本增效是每家公司的重點。正因為此,所有科技企業(yè)都將推動所有軟件工程師使用AI編程工具。

最后,程序員以及研發(fā)人員具有更強的“AI基礎素養(yǎng)”,更樂意利用、更可能用好AI編程輔助工具。

對于非技術類人員來說,即便是使用ChatGPT這樣的大眾化工具,也需要學習“Prompt(提示詞)”等技能,可見真正使用AI大模型來創(chuàng)作對大多數(shù)人來說是有門檻的,且普通人無法適應當前大模型技術結果的不確定性、不可靠。

對技術人才來說,以上問題不存在,因為他們是最善于使用工具、也樂于探索新工具的人群。程序員是“終身學習職業(yè)”職業(yè),他們一直在學習更先進的編程語言、尋覓更先進的工具、應用最先進的方法來提高工作效率與質量。在代碼大模型驅動下,AI編程工具如雨后春筍出現(xiàn),對應的研發(fā)體系、協(xié)作流程、管理方法、設計模式都將劇變,就算企業(yè)不推動,研發(fā)人員也會自主去探索和學習AI研發(fā)工具。

圖片

(CodeFuse IDE插件的代碼生成功能(部分))

Gartner發(fā)布的2024年十大戰(zhàn)略技術趨勢也指出:到2028年,75%的企業(yè)軟件工程師將使用AI編程助手。放眼未來,在助力企業(yè)研發(fā)板塊“降本增效”的同時,代碼大模型將更大程度地解放技術人員,讓他們專注于更高維度的創(chuàng)造工作。

AI編程進階:

從協(xié)助寫代碼到重構研發(fā)范式

從當前的AI編程實踐來看,代碼大模型正沿著兩個方向演進。

一條路是不斷提高代碼生成能力,做好程序員編程智能輔助工具。代碼生成、補全、解釋與轉換能力,從行級到片段到倉庫級不斷進化。在生成代碼時,支持多輪對話式需求理解,支持自然語言、語音、圖生代碼等多模態(tài)指令理解,這也是包括GitHub Copilot在內的AI編程平臺在主攻的方向,它們基于云提供SaaS服務或插件工具,著重于助力程序員提高代碼編寫的效率和質量。

另一條路則是讓AI滲透到研發(fā)的全生命周期,重構研發(fā)體系。

軟件開發(fā)涉及到需求分析、編程開發(fā)、測試與構建、發(fā)布與運維、數(shù)據洞察等鏈路。每一個鏈路都需要使用大量的專業(yè)工具,且與上下游研發(fā)鏈路進行協(xié)作。理論上來說,所有研發(fā)工具都可以被AI重做一遍,軟件研發(fā)范式(包括工具鏈、協(xié)作流程、項目管理方法、設計模式等等)都將被重構。

在國內,螞蟻CodeFuse 是AI全?命周期研發(fā)的首倡者和積極探索者。在內部,螞蟻已將?模型技術應?在研發(fā)的全鏈路環(huán)節(jié),在CodeFuse的版圖中,在需求階段,Project Copilot提供多場景開發(fā)助手,提供需求/設計文檔智能生成等服務;在開發(fā)、測試、運維和數(shù)據環(huán)節(jié),分別提供Code Copilot(IDE插件)、Test Copilot、Ops Copilot、Data Copilot等AI研發(fā)工具,大幅提高對應環(huán)節(jié)研發(fā)人員的工作效率。CodeFuse 在螞蟻內部被大規(guī)模應用在工業(yè)化生產場景,經過反復驗證與迭代后再以開發(fā)助手、IDE插件、AI Native IDE、Open API、開源等形式開放給行業(yè),同時也針對小程序開發(fā)等特殊場景定制了AIGC方案。

圖片

(螞蟻CodeFuse探索AI全?命周期研發(fā)范式)

第二種路線可被簡單地理解成企業(yè)研發(fā)的數(shù)智化升級,這將是科技類企業(yè)數(shù)智能升級中不容忽視的一環(huán)。自動駕駛技術不只是改變了車輛駕駛方式,也將重構出行、物流、道路、交管、法規(guī)等交通體系。同理,AI大模型不只是會提升程序員個體的工作效率,也將締造全新的研發(fā)范式。大部分的AI編程工具強調通用性,不大可能面向前端工程師提供“圖生代碼”這樣的細化服務,因此目前更多是影響個人開發(fā)者。但在AI大模型重構研發(fā)體系時,開發(fā)團隊更需要去做全生命周期的AI研發(fā)的頂層布局,在每一個鏈路中使用AI研發(fā)工具且采取全新的協(xié)作模式、管理方法。

AI研發(fā)勢不可擋,

IT技術人員何去何從?

回到開篇的問題:編程到底會不會消亡?

看上去,隨著AI編程技術的發(fā)展,人人都可用自然語言來編程,程序員確實將成為不復存在的職業(yè)。

但事實并非如此。

一方面,程序員的核心價值是“創(chuàng)造”,創(chuàng)造本身不可能被機器取代。自然語言編程只是降低了編程的“交互門檻”,但編程的根本是抽象思維、邏輯思維、系統(tǒng)思維、算法思維以及創(chuàng)造思維,特別是對物理世界的認知、理解與抽象,這些并非AI所長。

另一方面,產品研發(fā)不只是編程。正如前文所言,研發(fā)涉及到需求分析等等環(huán)節(jié),同時需要與產品運營、市場推廣、商業(yè)化等環(huán)節(jié)密切配合,這些更是AI不可能做好的事情,比如AI就不可能洞察到用戶有在手機上收發(fā)紅包這樣的細微需求,更不可能做出網絡紅包這樣的創(chuàng)新產品——當然,有了AI編程工具,網絡紅包的開發(fā)會更敏捷,更高效。螞蟻“2024支付寶五福節(jié)”的游戲中心項目代碼,就有30%由AI提交。

受過軟件開發(fā)專業(yè)訓練的人都知道,編程不等于寫代碼,項目管理、軟件測試、需求分析、算法、數(shù)據結構等等全鏈路研發(fā)技能也是所有計算機軟件類專業(yè)的必修課。正因為此,技術人員要盡可能地用好AI編程工具提升個體工作效率,同時增強復合型能力,當重復性等工作大幅減少可用更多時間“創(chuàng)造”,強化用戶需求分析、創(chuàng)意設計、業(yè)務理解、項目管理等能力。

正如螞蟻集團CodeFuse負責人所言:“AI的普及不僅可以減少開發(fā)人員的工作壓力,讓他們有更多精力投入到更有創(chuàng)造力的工作中去。”而AI研發(fā)范式的變革,并不代表“人”在研發(fā)場景的角色會消失,反而對AI和人如何協(xié)同提出了更高的要求。“AI目前主要集中在輔助編程(code copilot),編程要從copilot走向co-worker,甚至替代人,還有很多未解決的問題,而整個研發(fā)生命周期的AI自動化,還有很長的路要走。”

AI不會取代任何舊的職業(yè),但會淘汰思維陳舊的人。長期來看,AI將成為人類的助手,?機協(xié)同是AI發(fā)展的終局,這一點會在研發(fā)特別是編程場景率先體現(xiàn)。對于企業(yè)來說,研發(fā)是根基,其本質是用技術解決問題和創(chuàng)造產品,這將是硅基文明基礎生產方式。2024年的一個顯著趨勢是,編程以及研發(fā)本身,正在被AI大模型技術重構。所有技術人員必須擁抱AI研發(fā)的全新理念,適應新的研發(fā)協(xié)作模式。

是時候重新出發(fā)了。

       原文標題 : 巨頭狂卷代碼大模型

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號