要するに、グーグルは、開発者が日々書いている、公開されていない生々しいAndroidコードを探しているのだ。これは、サニタイズされた公開コード例よりもはるかに豊富で複雑なものだ 。グーグルから開発者へのメールによると、コードアクセスは「グーグルの開発者ツールとサービスの改善に役立てる」ために必要だと述べられている
。
開発者にとって重要なポイントは、これはコードの売却ではなく、アクセス権のライセンスであるということだ。複数のメディアが報じた条件は以下の通り。
グーグルがプライベートなコードベースに対して喜んで支払うという姿勢は、テクノロジー大手が訓練データを取得する方法の変化を示している。根底にあるのは、AI搭載コーディングツールにおける激しい競争だ。
公開コードリポジトリは既に広範囲に渡りスクレイピングされてきた。より有能なAIコーディングアシスタントを構築するには、公開されていない、成功したアプリを支える複雑で乱雑な現実世界のアーキテクチャの例が必要となる 。これは、GitHub Copilot(Microsoft/OpenAIが提供)やAnthropicのClaude Codeの直接的な競合としてグーグルが位置付ける、同社のGeminiモデルを直接的に強化するものであり、いずれも開発者を積極的にターゲットにしている
。
グーグル自身も最近、AIエージェントを端末からAndroid Studioに直接統合する「Android CLI 1.0」をリリースし、コーディングツールのエコシステムを再編している 。これらのツールに、プロプライエタリで本番グレードのAndroidコードを供給することで、競合が容易に複製できない差別化されたデータセットをグーグルに与えることになる。
どちらのプログラムも、非公開で価値の高いデータを購入する戦略的転換を反映している。しかし、その実行方法は大きく異なる。
レディットとの契約は、一般知識のための大規模で単発の取引だった。対照的に、パイロットプログラムは、Claude CodeやGitHub Copilotのような競合に対抗して、グーグルのAIコーディングツールを競争力のあるものにするという特定の問題を解決するため、個々の開発者に直接アプローチする、対象を絞った再現可能なモデルである 。
Comments
0 comments