Приложение теперь доступно на macOS, iOS и Android, но именно версия для macOS выводит на первый план стратегию курирования моделей . В отличие от открытых библиотек Ollama и LM Studio, где пользователи могут скачать почти любую совместимую модель, macOS AI Edge Gallery на данный момент предлагает пять отобранных Google моделей Gemma
. Как сообщает 9to5Mac, в число доступных входят Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, вариант Gemma-4 26B и FunctionGemma-270M
. Именно этот тщательно отобранный список и составляет сердце стратегии Google: контролируемая, гарантированно качественная среда
.
Под капотом экосистемы работает движок вывода LiteRT-LM от Google. Он может задействовать CPU, GPU и NPU на Linux, macOS и Windows . Главной моделью для замеров производительности остается Gemma-4-E2B (2,58 ГБ), и официальная документация дает четкое представление о ее возможностях на MacBook Pro M4
:
Колоссальный скачок скорости при задействовании GPU подчеркивает, насколько хорошо стек Google оптимизирован под графический API Metal от Apple Silicon, обеспечивая почти мгновенный и плавный пользовательский опыт.
Выпущенная под лицензией Apache 2.0, Gemma 4 12B — звезда этого запуска . Архитектура — ее главное отличие. Это плотный, чисто декодерный трансформер, использующий ту же продвинутую структуру декодера, что и гораздо более крупная модель Gemma 4 31B Dense
.
Ключевая инновация — ее мультимодальный дизайн без энкодеров. Большинство мультимодальных моделей используют отдельные, громоздкие энкодеры для зрения (например, ViT) и аудио (например, conformer layers), чтобы перевести данные для языковой модели . Gemma 4 12B полностью от них отказывается
. Вместо них используются:
Это позволяет модели нативно обрабатывать текст, изображения, аудио и видео в едином потоке . Google заявляет, что такая архитектура обеспечивает «производительность, близкую к нашей модели 26B MoE, с менее чем вдвое меньшим объемом памяти», и все это при работе на пользовательских ноутбуках с 16 ГБ унифицированной памяти
.
Бенчмарки подтверждают эту уверенность, показывая, что 12B-модель демонстрирует результаты значительно выше своего веса. На тесте GPQA Diamond (рассуждения уровня аспирантуры) она набирает впечатляющие 78,8 балла, приближаясь к варианту 26B. На академических тестах с множественным выбором, таких как MMLU Pro, она достигает 77,2%, а на соревновательном математическом бенчмарке AIME 2026 — 77,5% . На LiveCodeBench для генерации кода ее результат достигает 72,5%, демонстрируя устойчивые практические способности в агентных рабочих процессах и многошаговых рассуждениях
.
Дополняет трио продуктов Google AI Edge Eloquent — приложение для диктовки, позиционирующее себя как прямая, бесплатная альтернатива платным сервисам транскрибации . Приложение работает на базе моделей Gemma и разработано как офлайн-первое
.
Оно выходит за рамки простой транскрибации, выступая в роли автоматического редактора речи. Приложение «агрессивно вычищает» слова-паразиты вроде «э-э» и «ну», на лету исправляет грамматику и преобразует сырую, хаотичную речь в связный, профессиональный текст . Это делает его скорее инструментом коммуникации, нежели приложением для заметок. Ключевое преимущество — ценник: никакой подписки и никаких лимитов на использование
. Версия для macOS требует macOS 13.0 или новее и чип Apple M1 или новее, хотя на странице в App Store указано, что некоторые продвинутые опциональные функции могут потребовать облачной обработки
.
Этот запуск утвердил две противоположные философии локального AI. Стратегия Google — это подход «закрытого сада»: курируемый, одобренный Google набор моделей, тесно интегрированный с брендированными фирменными приложениями (Gallery для исследований, Eloquent для диктовки) и унифицированным движком вывода (LiteRT-LM) с CLI и Python API . Цель — предоставить бесшовный опыт уровня потребительских продуктов, который «просто работает» из коробки.
Это прямая противоположность Ollama и LM Studio, которые ставят во главу угла максимальную гибкость и выбор, являясь открытыми библиотеками, где пользователи могут скачать любую совместимую модель . Примечательно, что и Ollama, и LM Studio уже поддерживают открытую модель Gemma 4 12B, так что модель Google не является эксклюзивной для ее собственного стека
.
Преимущество Google заключается в фирменной оптимизации, где ее собственные модели специально настроены для работы на ее движке вывода на Apple Silicon, обеспечивая лучшую производительность и меньшее потребление памяти. Компромисс для пользователя очевиден: вы получаете более отполированный и интегрированный опыт, но не можете запускать модели вне курируемого семейства Gemma от Google. Это позиционирует Google как выбор для пользователей, которые ценят надежность и простоту использования выше экспериментальной свободы, создавая явную развилку на пути развития локального AI на Mac.
Comments
0 comments