Disponible en macOS, iOS y Android, la versión para ordenadores de Apple saca a relucir una estrategia muy concreta . Frente a la libertad de Ollama o LM Studio, que permiten instalar casi cualquier modelo compatible, la app de Google para macOS te da acceso a una selección muy exclusiva: cinco modelos Gemma curados por la compañía
. Según reportó 9to5Mac, los modelos disponibles incluyen Gemma-4-12B-it, Gemma-4-E2B-it, Gemma-4-E4B-it, una variante de Gemma-4 26B y FunctionGemma-270M
. Este 'muro' de contenidos es el corazón de la apuesta de Google: un entorno controlado que garantiza calidad y estabilidad
.
Todo este ecosistema funciona sobre el motor de inferencia LiteRT-LM, propiedad de Google, compatible con CPU, GPU y NPU en Linux, macOS y Windows . El modelo de referencia para las pruebas de rendimiento sigue siendo el Gemma-4-E2B (2,58 GB). La documentación oficial muestra de lo que es capaz en un MacBook Pro M4
:
El salto abismal de velocidad al usar la GPU demuestra lo afinada que está la pila de Google para la API Metal de los chips de Apple, ofreciendo una experiencia fluida y prácticamente instantánea.
Publicado bajo la licencia de código abierto Apache 2.0, Gemma 4 12B es la verdadera estrella de este lanzamiento . Su arquitectura, un transformador denso solo decodificador, es su gran factor diferencial, ya que utiliza la misma estructura avanzada del mucho más grande Gemma 4 31B Dense
.
La innovación clave reside en su diseño multimodal sin codificadores. Los modelos multimodales tradicionales usan codificadores separados y pesados para la visión (como un ViT) y el audio (como capas conformer) que traducen los datos para el modelo de lenguaje . Gemma 4 12B los elimina por completo
. En su lugar, emplea:
Esto permite que el modelo procese de forma nativa texto, imágenes, audio y vídeo en un flujo unificado . Google asegura que esta arquitectura logra “un rendimiento cercano al de nuestro modelo MoE de 26B con menos de la mitad de memoria”, y todo ello funcionando en portátiles de consumo con solo 16 GB de memoria unificada
.
Los puntos de referencia lo confirman, mostrando que este modelo de 12B compite en una liga muy superior. En GPQA Diamond, una prueba de razonamiento de nivel de posgrado, obtiene un impresionante 78,8, situándose cerca de la variante de 26B. En pruebas académicas tipo test como MMLU Pro alcanza un 77,2%, y en el exigente examen de matemáticas AIME 2026 logra un 77,5% . En LiveCodeBench, una prueba para generación de código, consigue un 72,5%, demostrando gran capacidad en tareas de flujos de trabajo agénticos y razonamiento multi-paso
.
AI Edge Eloquent es la apuesta de Google por jubilar a los servicios de transcripción de pago con una aplicación de dictado basada en modelos Gemma . Su principal reclamo es un funcionamiento totalmente local y sin conexión
.
Pero Eloquent va mucho más allá de una simple transcripción. Actúa como un editor automático del habla que “recorta agresivamente” muletillas como “eh” o “mmm”, corrige la gramática al vuelo y reestructura el habla caótica para convertirla en un texto coherente y profesional . No es una herramienta para tomar notas, es una herramienta de comunicación. El gran diferenciador está en el precio: sin suscripción y sin límite de uso
. La versión para macOS requiere macOS 13.0 y un chip Apple M1 o posterior, aunque en la App Store se advierte que algunas funciones avanzadas opcionales pueden requerir procesamiento en la nube
.
Este lanzamiento establece dos filosofías opuestas para la IA local. Por un lado, Google apuesta por un enfoque de "jardín amurallado": un conjunto de modelos curados, aprobados por la propia Google y estrechamente integrados con aplicaciones de marca propia (Gallery para explorar y Eloquent para dictar), todo bajo un mismo motor de inferencia unificado (LiteRT-LM) con CLI y API de Python . El objetivo es proporcionar una experiencia de consumo impecable que funcione nada más sacarla de la caja.
En el lado opuesto se sitúan Ollama y LM Studio. Su prioridad es la máxima flexibilidad y libertad, funcionando como bibliotecas abiertas donde el usuario puede instalar cualquier modelo compatible . De hecho, ambas plataformas ya ofrecen soporte para el modelo abierto Gemma 4 12B, por lo que la tecnología de Google no es exclusiva de su propio ecosistema
.
La ventaja de Google reside en una optimización de primera parte, donde sus propios modelos están ajustados para su motor de inferencia en los chips de Apple, logrando un mejor rendimiento y un menor consumo de memoria. La elección para el usuario es clara: una experiencia más pulida e integrada a cambio de renunciar a ejecutar modelos que no pertenezcan a la familia Gemma. Google busca así captar a los usuarios que priorizan la fiabilidad y la facilidad de uso frente a la experimentación total, abriendo una bifurcación definitiva en el camino de la IA local en Mac.
Comments
0 comments