Внутри GenAI‑миграции: как Deutsche Börse перенесла 2000+ Zeppelin‑ноутбуков в Databricks
Deutsche Börse разработала собственное приложение Databricks с генеративным ИИ для миграции более 2000 ноутбуков Apache Zeppelin из Cloudera в Databricks. Архитектура разделяет задачу на две части: детерминированную конверсию структуры ноутбуков и AI‑помощь при восстановлении аналитической и бизнес‑логики.
How did Deutsche Börse use a custom GenAI-powered Databricks App to migrate more than 2,000 Zeppelin notebooks from Cloudera to Databricks aDeutsche Börse used a custom Databricks App combining deterministic conversion and generative AI to migrate thousands of Zeppelin notebooks.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: How did Deutsche Börse use a custom GenAI-powered Databricks App to migrate more than 2,000 Zeppelin notebooks from Cloudera to Databricks a. Article summary: Deutsche Börse’s StatistiX team built a custom Databricks App to turn a 2,000+ Zeppelin-notebook migration into a semi-automated, AI-assisted workflow: deterministic code handled notebook structure, while GenAI helped us. Topic tags: general, documentation, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Introducing Databricks GenAI Partner Accelerators for Data Engineering & Migration. Speed up data engineering and data migration with GenAI and agentic accelerators built by Data" source context "Introducing Databricks GenAI Partner Accelerators for Data Engineering & Migration | Databricks Blog"
openai.com
Крупные миграции аналитических платформ часто срываются не из‑за инфраструктуры, а из‑за огромного количества аналитических артефактов — ноутбуков, скриптов и пайплайнов, которые приходится пересобирать вручную. Именно с такой проблемой столкнулась Deutsche Börse, когда ей нужно было перенести более 2000 Apache Zeppelin ноутбуков из среды Cloudera в Databricks до закрытия старой платформы.
Вместо попытки автоматически переписать весь код одним шагом компания разработала собственное GenAI‑приложение внутри Databricks, которое разделяет задачу на две части: механическую конверсию структуры и восстановление аналитической логики с помощью генеративного ИИ.
Почему вообще понадобилась миграция
Причина была довольно прагматичной: в экосистеме Cloudera инструмент Apache Zeppelin постепенно выводится из эксплуатации. В документации Cloudera отмечается, что Zeppelin был признан устаревшим (deprecated) и больше не поддерживается в новых версиях runtime, поэтому долгосрочно полагаться на него рискованно.
Для команды StatistiX внутри Deutsche Börse это означало серьёзную проблему масштаба. За годы работы аналитики и инженеры накопили более 2000 ноутбуков, содержащих важную бизнес‑логику, трансформации данных и аналитические процессы. Переписывать их вручную заняло бы огромные ресурсы и потребовало бы координации между множеством команд.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Каков краткий ответ на вопрос «Внутри GenAI‑миграции: как Deutsche Börse перенесла 2000+ Zeppelin‑ноутбуков в Databricks»?
Deutsche Börse разработала собственное приложение Databricks с генеративным ИИ для миграции более 2000 ноутбуков Apache Zeppelin из Cloudera в Databricks.
Какие ключевые моменты необходимо проверить в первую очередь?
Deutsche Börse разработала собственное приложение Databricks с генеративным ИИ для миграции более 2000 ноутбуков Apache Zeppelin из Cloudera в Databricks. Архитектура разделяет задачу на две части: детерминированную конверсию структуры ноутбуков и AI‑помощь при восстановлении аналитической и бизнес‑логики.
Что мне делать дальше на практике?
Время миграции одного ноутбука сократилось с нескольких часов до примерно 15–20 минут, что означает сотни часов работы вместо тысяч при ручной миграции.
Главный архитектурный инсайт проекта заключался в том, чтобы не пытаться переводить весь ноутбук с помощью одного AI‑запроса. Вместо этого разработчики разделили задачу на два разных типа операций.
1. Конверсия структуры (детерминированная)
Некоторые элементы Zeppelin‑ноутбуков легко формализуются и переводятся по правилам:
преобразование параграфов Zeppelin в ячейки Databricks
перевод синтаксиса интерпретаторов
перенос и форматирование метаданных
Эти операции полностью предсказуемы, поэтому их можно реализовать обычным кодом и автоматизацией без генеративного ИИ.
2. Восстановление логики (с помощью GenAI)
Настоящая сложность скрыта внутри аналитической логики: бизнес‑правила, трансформации данных и аналитические шаги часто требуют интерпретации.
Вместо рискованной автоматической переписи инструмент использует генеративный ИИ, который помогает пользователю воссоздать смысл и логику ноутбука. Для этого система генерирует контекстные подсказки (prompts) для Databricks Genie — AI‑ассистента платформы.
Таким образом:
автоматизация занимается механической частью
генеративный ИИ помогает понять и восстановить логику
человек подтверждает корректность результата
Такой гибридный подход значительно повышает надёжность миграции.
Архитектура приложения Databricks
Инструмент был реализован как Databricks App — приложение, которое запускается прямо внутри рабочей среды Databricks. Это позволяет пользователям работать с миграцией без внешних инструментов.
В архитектуре присутствовали несколько ключевых компонентов:
пользовательский интерфейс, который пошагово проводит через миграцию
автоматический модуль преобразования структуры Zeppelin‑ноутбуков
система генерации контекстных AI‑запросов
проверка и подтверждение логики пользователем (human‑in‑the‑loop)
Такой дизайн позволил подключить к процессу самих аналитиков и владельцев ноутбуков, при этом сохраняя контроль и управляемость процесса.
Как выглядел процесс миграции
Рабочий процесс обычно проходил в четыре шага.
1. Загрузка ноутбука
Пользователь экспортирует Zeppelin‑ноутбук и загружает его в приложение Databricks.
2. Автоматическая конверсия структуры
Приложение преобразует оболочку ноутбука — структуру параграфов, синтаксис интерпретатора и метаданные — в формат Databricks.
3. Восстановление логики с помощью AI
Система генерирует контекстные prompts, которые помогают Databricks Genie воспроизвести аналитическую логику и шаги обработки данных.
4. Проверка человеком
Аналитик проверяет результат, корректирует код и подтверждает правильность бизнес‑логики.
В итоге процесс объединяет автоматизацию, генеративный ИИ и экспертную проверку.
Сколько времени удалось сэкономить
До появления инструмента переписывание одного ноутбука обычно занимало несколько часов ручной работы.
После внедрения приложения время сократилось до примерно 15–20 минут на ноутбук.
Если пересчитать для всей миграции:
2000 ноутбуков × 15–20 минут
примерно 500–667 часов работы в новой системе
При ручной миграции общий объём мог бы составлять несколько тысяч часов инженерной работы.
Почему этот кейс считается практическим применением GenAI
Многие проекты с генеративным ИИ сталкиваются с проблемой: они выглядят впечатляюще, но не дают измеримой бизнес‑ценности.
Кейс Deutsche Börse выделяется по нескольким причинам.
Чётко ограниченная задача
Проект решает конкретную проблему — миграцию устаревших аналитических ноутбуков.
Гибридная автоматизация
Правила используются там, где всё предсказуемо, а генеративный ИИ применяется только для задач интерпретации.
Контроль со стороны человека
Аналитики проверяют бизнес‑логику — критически важный фактор для финансовой индустрии с жёсткими требованиями к управлению рисками.
Часть более широкой облачной трансформации
Миграция ноутбуков — лишь один элемент масштабной модернизации инфраструктуры Deutsche Börse.
Компания активно переносит системы и аналитические платформы в облако. Например, при переносе инфраструктуры индекса DAX на Google Cloud были достигнуты результаты, включая:
снижение совокупной стоимости владения примерно на 33%
миграцию более 60 приложений
сокращение времени восстановления после сбоев для ключевых SAP‑систем примерно на 85%.
Кроме того, группа сообщала, что более половины её рабочих нагрузок уже работают в облаке, что отражает стратегический переход к облачным платформам для данных и аналитики.
В такой трансформации перенос аналитических активов — включая ноутбуки — является необходимым шагом: без этого новые облачные платформы не могут полностью раскрыть свой потенциал.
Итог
Подход Deutsche Börse показывает практичную модель внедрения генеративного ИИ в корпоративной разработке:
автоматизировать детерминированные задачи обычным кодом
использовать GenAI там, где требуется интерпретация
сохранять участие человека в критически важной бизнес‑логике
Благодаря этому компания смогла превратить потенциально огромный ручной проект миграции в полуавтоматический процесс, сократив время переработки каждого ноутбука до минут и сохранив контроль над аналитической логикой.
cloud.google.comDeutsche Börse Group case study | Google Cloud
Comments
0 comments