Databricks Genieの精度面での主張は、汎用コーディングエージェントより上手にコードを書く、という話ではない。企業データ分析では、SQLの構文よりも先に、そもそも「売上」とは何を指すのか、どのテーブルを正とするのか、どの期間や顧客区分で見るべきなのかが問題になる。
Databricksは、実世界のデータ分析タスクを使った社内ベンチマークで、Genieが主要なコーディングエージェントの32%に対し、90%超の総合精度を示したと報告している [3]。ただし、この数字はDatabricks自身が公表した内部ベンチマークに基づくもので、独立した第三者評価として扱うべきものではない [
3]。
精度を分けるのは「コード力」より「業務文脈」
汎用コーディングエージェントは、SQLやPythonの生成では役に立つ。しかし企業の分析質問は、多くの場合、プロンプトだけでは完結しない。
たとえば「なぜ売上が落ちたのか」と聞かれたとき、必要なのは単にクエリを書くことではない。承認済みの売上定義、対象となる顧客セグメント、正しい期間、参照すべきダッシュボードやテーブルを見極める必要がある。
MicrosoftのAzure Databricksドキュメントでは、Genieは組織の用語やデータに合わせた生成AI機能として説明されている。Genieスペースは、データセット、サンプルクエリ、テキストガイドラインを使って、業務上の質問を分析クエリへ変換しやすくするよう、ドメイン専門家が設定する [7]。つまり、モデルに丸投げするのではなく、答える前に問題空間を業務に合わせて絞り込む設計だ。
1. Genieはプロンプトだけでなく、企業固有の意味を使う
企業内の「売上」「アクティブ顧客」「解約」「粗利」といった言葉は、会社や部門によって定義が異なる。自然言語の質問だけを見ても、正しい分析にはたどり着きにくい。
Genieスペースでは、ドメイン専門家が対象データセット、クエリ例、説明文を与え、Genieが質問をどう解釈するかを調整できる [7]。さらに、ユーザーからのフィードバックをもとに性能を監視・改善できるとも説明されている [
7]。






