Databricks Genie не пытается обойти coding agents как универсальный программист. Его ставка другая: корпоративная аналитика чаще ломается не на синтаксисе SQL, а на контексте. Чтобы ответить на вопрос бизнеса, агенту нужно понять терминологию компании, найти доверенный набор данных, выбрать правильную метрику, сформировать запрос и объяснить результат.
Databricks заявляет, что на внутреннем бенчмарке реальных задач анализа данных Genie показал свыше 90% общей точности против 32% у ведущего агента для написания кода [3]. Это сильная заявка, но важная оговорка вшита в само описание: речь идёт о внутреннем тесте Databricks, а не о независимой проверке [
3].
Главная идея: точность даёт не код, а контекст
Обычный coding agent может помочь написать SQL или Python. Но в большой компании вопрос вроде «почему упала выручка?» не самодостаточен. Нужно знать, какая таблица считается канонической, что именно компания называет выручкой, какие фильтры применяются, какой период сравнивается и какие уже существуют отчёты, ноутбуки или дашборды.
Genie изначально проектируется вокруг этой проблемы. В документации Microsoft по Azure Databricks Genie описан как генеративный ИИ, адаптированный к терминологии и данным организации; пространства Genie настраивают профильные эксперты, добавляя датасеты, примеры запросов и текстовые инструкции, чтобы переводить бизнес-вопросы в аналитические запросы [7]. Иными словами, задача сужается ещё до того, как модель начинает генерировать ответ.
Почему обычный агент для кода может промахнуться
Универсальный агент хорошо выглядит там, где достаточно написать корректный код. В аналитике этого мало: запрос может быть синтаксически правильным, но аналитически неверным. Например, модель может выбрать таблицу, которая уже не считается источником истины, или применить не ту логику расчёта метрики.






