喺 2026 年 6 月 2 日嘅 Microsoft Build 大會上,微軟推出咗 MAI-Code-1-Flash 。呢個係一個擁有 50 億活躍參數嘅編碼模型,完全由微軟自己用授權數據由頭到尾訓練出嚟,冇用過 OpenAI、Anthropic 或者其他第三方模型做「蒸餾」
。模型採用稀疏型混合專家架構,總參數量達 1370 億,擁有 256,000 token 嘅上下文視窗,並喺 2026 年 3 月到 5 月期間,喺 GitHub Copilot 嘅生產環境入面進行訓練——意味住個模型係學緊真實開發者嘅工作流程,之後亦會用嚟服務返呢啲流程
。
結果係,呢個模型喺微軟嘅對抗性編碼基準測試中攞到 85.8% 嘅分數,喺 SWE-Bench Pro 嘅基準測試大約攞到 51%,表現比 Anthropic 嘅 Claude Haiku 4.5 高出 16 個百分點,同時喺處理複雜編碼任務時,消耗嘅 token 少咗最多 60% 。MAI-Code-1-Flash 由 6 月 2 日起,開始喺 Visual Studio Code 入面推送畀 GitHub Copilot 嘅免費用戶、Pro、Pro+ 同 Max 計劃嘅用戶,第三方開發者亦可以透過 Fireworks AI、Baseten 同 OpenRouter 用到
。
OpenAI 喺 2025 年 4 月推出咗 Codex,一個可以平行處理多項任務嘅雲端軟件工程 Agent 。到咗 2026 年 4 月,佢嘅每週活躍用戶已經超過咗 400 萬
。呢個平台之後擴展成一個涵蓋應用程式、命令行介面、IDE 擴展同雲端嘅模型家族,而且各個介面互相加強緊
。
Codex 進化嘅主要里程碑:
Anthropic 嘅 Claude Code,喺 2025 年「與 Claude 一齊寫 Code」活動上推出,係 AI 編碼市場入面商業表現最驚人嘅一個。佢喺 2025 年 5 月推出後短短幾個月內,年度經常性收入就突破咗 5 億美金,2025 年底達到 10 億,到咗 2026 年 2 月更加超過咗 25 億——呢個速度甚至快過 ChatGPT 早期嘅採用率 。Anthropic 嘅整體收入,由 2025 年底嘅大約 90 億美金,攀升到 2026 年春季嘅超過 300 億美金,主要都係由 Claude Code 帶動
。
喺 2026 年 5 月 28 日,Anthropic 發佈咗 Claude Opus 4.8——一個擁有 100 萬 token 上下文視窗嘅混合推理模型,將長時間嘅 Agent 任務推向新極限。Anthropic 報告話,佢比起 Opus 4.7,放過自己寫嘅 code 入面嘅缺陷而唔出聲嘅機會率,大約低四倍 。
由寫 code 變成監督 Agent,呢個轉變唔係遙遠嘅預測——而係全球最大嘅軟件機構而家嘅運作模式。Pichai 解釋,Google 嘅工程師越嚟越似審閱者同編排者,多過逐行寫 code 嘅人。佢哋用嘅 AI Agent 會自己規劃、寫 code、做測試同執行複雜任務 。
Anthropic 嘅《2026 年 Agent 編碼趨勢報告》清楚咁形容咗呢個轉變:喺 2025 年,編碼 Agent 由實驗工具,變成咗可以將真實功能出貨畀真實客戶嘅生產系統。AI 而家處理到成個實作流程——寫測試、debug、生成文檔,同喺越嚟越複雜嘅程式庫入面遊走。報告預測,單一 Agent 好快會變成互相協調嘅 Agent 團隊,以往要幾個鐘甚至幾日先完成到嘅任務,將會喺極少人為干預下搞掂 。
呢種重新定義工程師角色嘅情況,喺各大平台都見到:
生產力嘅提升都好戲劇性。Claude Code 示範咗喺一個鐘頭之內,就可以架構一個複雜嘅分散式系統——報告聲稱,呢項工作之前要令到一個 Google 項目搞足成一年先完成到 。微軟亦都話,MAI-Code-1-Flash 喺處理複雜任務時,比起同類模型用少最多 60% 嘅 token
。
喺用戶嘅問題入面,提到咗一啲具體嘅勞動市場數字——美國工程師職位空缺增加 30%,而 22 至 25 歲嘅開發者就業率就跌咗接近 20%。呢啲精確嘅數字喺現有嘅資料來源入面,未能獨立核實到。不過,現有證據描繪出嘅景象好一致:呢個專業正面臨兩極化,而唔係崩潰。
Anthropic 嘅趨勢報告指出,公司而家係請緊更多工程師,唔係更少,因為 AI 令到出貨更快,可以做更有價值嘅工作 。需求係轉向咗嗰啲可以架構系統、審閱 AI 生成嘅輸出,同埋做高層次設計決策嘅資深工程師。喺 Google,內部對 Agent 輔助程式碼改動嘅目標,加上公司話工程人員編制持續增長,都顯示出 AI 係用嚟放大產出,而唔係直接取代工程師
。
現有資料入面最逼切嘅關注點,係早期職業生涯嘅工程師會點。初級開發者傳統上係透過做 routine 嘅 coding 任務嚟累積技能——例如修復 bug、寫測試、實現簡單嘅功能。而呢啲任務,正正係而家最有效率咁畀 AI Agent 吸收咗嘅工作。多個消息來源都形容呢個係一個「經驗斷層」問題:如果 AI 處理咗晒入門級嘅 coding 工作,咁新晉工程師點樣學到足夠經驗成為資深嘅人呢 ?
喺提供嘅資料入面,冇任何來源提供到呢個挑戰嘅可行解決方案。背後嘅含意係,呢個職業將會需要新嘅培訓管道、師徒指導結構,同埋一條重新定義嘅晉升階梯——但呢啲改變仍然喺摸索階段。
發展軌跡係明確嘅。Google 由 25% 嘅 AI 生成程式碼去到 75%,用咗十八個月。Claude Code 由零到 25 億美金嘅年度經常性收入,用咗唔夠一年。OpenAI 嘅 Codex 由一個單 Agent 嘅命令行工具,成長到一個橫跨桌面、雲端同 IDE 嘅多 Agent 平台,都係用咗差唔多嘅時間 。
未解決嘅問題,唔係 AI 編碼 Agent 會唔會繼續進步——佢哋一定會——而係工程機構、教育機構同個別開發者,將會點樣適應一個咁樣嘅專業:寫 code 呢個動作,越嚟越交畀機器處理,而人類嘅角色,就係去引導、審查同決定要建造啲乜嘢。
Comments
0 comments