簡單來說,Google 在找開發者日常寫的、充滿現實世界妥協與真實架構的 Android 程式碼。這些未經修飾的「職人碼」遠比公開的教學範本複雜,也更具訓練價值 。Google 在給開發者的信中僅保守地提到,存取程式碼是為了「協助改善 Google 的開發者工具與服務」
。
對開發者來說,這項計畫最具吸引力的地方在於:這不是賣斷程式碼,而是一種使用授權。
根據多家媒體披露的條款細節:
這有點像是將你的程式碼當成一本書,賣給 Google 翻閱學習的權利,但書本的主人依然是你。
背後是一場無聲的 AI 軍備競賽。
公開的程式碼倉庫(例如 GitHub 上的開源專案)早已被各大 AI 模型「爬」得差不多。對於想要打造頂尖 AI 程式開發工具的 Google 來說,下一個瓶頸就是缺乏「真實世界」中複雜、混亂且充滿商業邏輯的生產品質程式碼。這些資料公開領域找不到,只能用買的 。
這批資料將直接注入 Google 旗下的 Gemini 模型,其定位正是要與微軟和 OpenAI 聯手打造的 GitHub Copilot、以及 Anthropic 的 Claude Code 正面對決 。
Google 近期也大幅重組了其程式開發工具體系,發布了 Android CLI 1.0,讓 AI 代理能直接從終端機操控 Android Studio 的功能 。有了這批專屬的、生產品質的 Android 程式碼,Google 將能打造出差異化程度極高的訓練資料集,這是其他競爭對手難以快速複製的護城河。
這不是 Google 第一次為了 AI 訓練而花大錢買資料。我們可以將這次的試辦計畫,與先前那筆震撼業界的 Reddit 交易對照來看:
簡單來說,Reddit 交易是為了讓 AI 更懂「人話」;而收購程式碼,則是為了讓 AI 更會寫「程式」。Google 從砸大錢簽下獨家的大單,轉向建立一個可不斷重複操作、直接找上獨立開發者解決特定問題的新商業模式。
Comments
0 comments