Databricks Genie 唔係想同 coding agent 鬥做更勁嘅萬能 coder。佢嘅準確度賣點係:企業 analytics 其實係一個「語境」問題。AI 要先明白公司入面「收入」、「活躍客戶」、「流失」呢類詞點定義,搵到可信數據資產,再生成 query 同解讀結果。Databricks 指,在一個內部真實數據分析任務 benchmark 入面,Genie 整體準確率達逾 90%,而一款領先 coding agent 為 32%;不過,呢個 benchmark 係 Databricks 自行公布,未見獨立第三方驗證 [3]。
換句話講,今次比較唔只係「邊個寫 SQL 寫得順」。落到企業數據,行得通嘅 query 唔等於答案啱;揀錯表、用錯指標定義、漏咗業務規則,一樣可以得出好似合理但其實錯晒嘅結論。
企業數據問題,唔係一句 prompt 就夠
好多公司入面,一條自然語言問題其實唔係自包含。問「點解收入跌咗?」表面簡單,但背後可能牽涉認可收入定義、客戶分群、時間窗、應該用邊張 canonical table,甚至以前 dashboard 或 notebook 入面已經沉澱落嚟嘅分析脈絡。
Microsoft Learn 的 Azure Databricks 文件形容 Genie 係一種針對機構術語同數據調整嘅 generative AI;domain expert,例如熟悉業務範疇嘅數據分析員,可以用 datasets、sample queries 同 text guidelines 去設定 Genie spaces,幫 Genie 將業務問題翻譯成分析查詢 [7]。呢個設定步驟等於先幫模型收窄問題範圍,唔使單靠用戶一句 prompt 去估。
1. Genie 用企業語義,而唔只係讀 prompt
一般 coding agent 可以幫你寫 SQL 或 Python,但企業分析最麻煩嘅位,往往係「同一個詞喺公司入面真正代表乜」。例如 revenue 應該跟邊個已核准定義?應否排除某些客戶群?時間範圍點切?邊張表先係可信來源?
Genie spaces 讓 domain expert 提供數據集、示例查詢同文字指引,去影響 Genie 點樣理解問題 [7]。同一份文件亦指出,機構可以透過用戶回饋去監察同改進 Genie 表現 [
7]。所以 Genie 準唔準,唔係純粹靠模型「聰明」,而係睇公司有冇將正確語境、定義同例子放入系統。
2. 佢落喺受治理嘅 Databricks 數據資產上
Genie 係為 Azure Databricks 入面嘅自然語言數據互動而設,前提係團隊已為 Genie space 設定相關數據同指引 [7]。有技術文章亦形容 Genie 係疊喺 curated datasets、AI/BI 資產同 business context 上面嘅對話層;答案質素好大程度取決於底層 semantic model 是否清楚捕捉業務定義 。






