Gemini Omni Flash — это не просто «сшиватель» картинок. В ее основе лежит трансформерная архитектура, которая анализирует любую комбинацию текста, изображений, аудио и видео, чтобы выдать единый, связный результат . Google утверждает, что это дает модели тип «миро-ориентированного» интеллекта: она применяет законы физики, кинетики, истории и культурный контекст, чтобы сгенерированные сцены выглядели правдоподобно
.
Модель объединяет в себе «мозги» Gemini и проверенные генеративные медиамодели, такие как Veo, Nano Banana и Genie . В итоге получается система, способная принять текстовый промпт, референсное изображение, аудиосэмпл и существующий видеоклип одновременно, а затем сплести их в новый 10-секундный ролик с синхронизированным звуком
.
Каждое видео, созданное Omni Flash, снабжено незаметным водяным знаком SynthID, что помогает отслеживать происхождение контента и идентифицировать его как сгенерированный ИИ . Хотя 10-секундная длительность может показаться ограничением, в Google заявили, что это осознанный выбор для первого запуска, а не технический потолок модели
.
Важно отметить: хотя вы можете сгенерировать видео со звуком, модель пока не позволяет отдельно редактировать речь или аудиодорожку внутри созданного видео — эту возможность Google намеренно придерживает .
Google развернула Gemini Omni Flash по всему миру в день анонса, разделив доступ между бесплатными и платными уровнями .
Доступ к API для разработчиков и корпоративных клиентов пока не открыт. Google обещает запустить его «в ближайшие недели» через Gemini API и Vertex AI, следуя уже знакомому шаблону предыдущих релизов моделей Gemini .
Всего через несколько недель после анонса Google на сцену вышла совершенно иная философия. В конце мая 2026 года на презентации Xiaomi 17T Pro в Вене — телефона, оснащенного камерами, созданными при участии Leica, и возможностями Gemini Omni, — компания Leica четко обозначила свою позицию по отношению к генеративному ИИ .
Представитель Leica, Мариус Эшвайлер, вице-президент бизнес-подразделения Mobile в Leica Camera AG, заявил, что философия компании вращается вокруг создания аутентичных изображений, воспроизводящих реальность . Он провел прямую параллель с инструментами вроде Omni, сказав: «Скорее всего, вы не увидите этого на камере Leica M», подчеркнув приверженность бренда оптическому мастерству и чистоте запечатленного момента
.
Тем не менее, Leica не стала полностью отвергать технологию. Руководство компании признало, что генеративный ИИ прекрасно вписывается в концепцию смартфона. В экосистеме, где вычислительная фотография уже является стандартом, создание и редактирование с помощью ИИ воспринимаются как естественная эволюция пользовательского опыта, а не отход от традиций . Эта позиция формирует четкую двойную стратегию: преданные своему делу камеры Leica остаются пуристским инструментом для улавливания света, в то время как телефоны становятся холстом для творчества с помощью ИИ.
Google была на удивление прямолинейна в том, что Flash — это только первый шаг. И Сундар Пичаи, и технический директор DeepMind Корай Кавукчуоглу назвали Omni семейством моделей, которое в конечном счете сможет «создавать что угодно из чего угодно» .
На практике это означает два основных направления на ближайшее будущее:
На более высоком уровне Google рассматривает Omni как шаг к полноценным «мировым моделям» — системам, которые не просто генерируют медиа, но могут понимать, симулировать и взаимодействовать с окружающей средой во всех модальностях . На данный момент главная задача — расширить форматы, которые Omni может генерировать, и предоставить API-доступ в руки разработчиков.
Comments
0 comments