Gemini combina la instrucción con lo que detecta en pantalla para generar la respuesta. Según los investigadores de Google, el objetivo es eliminar el llamado “desvío hacia la IA”, el proceso habitual de copiar contenido a un chatbot y luego explicar qué quieres hacer con él.
La primera implementación práctica llegará al navegador Chrome. Allí los usuarios podrán apuntar a una parte específica de una página web y hacer preguntas sobre ese contenido concreto.
Entre las capacidades mencionadas se encuentran:
En algunos casos, el sistema puede activarse al mover o “sacudir” ligeramente el cursor, lo que muestra acciones rápidas relacionadas con el contenido debajo. Por ejemplo, si apuntas a una fecha en un correo electrónico, podría sugerir crear un evento en el calendario.
Informes recientes indican que la función está empezando a desplegarse en Chrome para escritorio, incluyendo Windows y macOS, aunque Google todavía no ha detallado qué regiones recibirán la función primero ni el calendario completo de lanzamiento.
La integración en Chrome es solo una parte del plan. Google también presentó Googlebook, una nueva categoría de portátiles diseñada desde el inicio alrededor de la inteligencia Gemini.
Estos equipos están previstos para lanzarse en otoño de 2026 e incluirán Magic Pointer integrado a nivel del sistema.
Eso significa que el cursor podría interactuar con contenido en múltiples aplicaciones, no solo en el navegador. Algunos ejemplos mostrados en demostraciones y primeras coberturas incluyen:
Algunos reportes describen los Googlebook como una mezcla entre Android y sistemas basados en Chrome, aunque la arquitectura final y los detalles de compatibilidad con apps aún no se han confirmado completamente.
Google DeepMind ha publicado demostraciones experimentales que muestran cómo funcionaría este cursor con IA en la práctica. Dos de ellas están disponibles en Google AI Studio.
Demo de edición de imágenes: el usuario señala una parte de la imagen y pide a Gemini que la modifique —por ejemplo, cambiando colores o alterando un objeto— sin usar herramientas tradicionales de edición.
Demo de mapas: el usuario apunta a ubicaciones en un mapa y hace preguntas o pide recomendaciones relacionadas con ese lugar.
Estas demostraciones ilustran la idea principal: usar el puntero como una interfaz contextual entre el usuario y la IA en distintos tipos de software.
Por ahora, el desarrollo tiene varios hitos conocidos:
Sin embargo, todavía no se conocen detalles sobre modelos concretos, precios, controles empresariales o disponibilidad por regiones.
A pesar de lo prometedor de las demostraciones, la tecnología aún está en una fase temprana.
Pruebas iniciales indican que la función puede resultar impresionante en demos, pero todavía no siempre funciona con fluidez en flujos de trabajo reales, especialmente cuando la interfaz es compleja o el elemento señalado es ambiguo.
Entre los desafíos técnicos posibles están:
Por ahora, es probable que funcione mejor en entornos donde Google puede interpretar claramente la estructura del contenido, como páginas web en Chrome, imágenes, PDFs o mapas.
Magic Pointer necesita analizar lo que aparece cerca del cursor para entender el contexto. Eso implica que el sistema podría examinar partes del contenido visible en la pantalla.
Si la función llega a integrarse a nivel de sistema operativo, ese contexto podría incluir:
Google aún no ha explicado en detalle si ese análisis se realiza localmente en el dispositivo o en la nube, cómo se almacenan esos datos ni cuánto tiempo se conservan. Hasta que esos detalles estén claros, el modelo de privacidad de la función sigue siendo una incógnita.
Magic Pointer forma parte de una idea más amplia: crear interfaces de computadora diseñadas para la era de la IA.
El software tradicional depende de menús, botones y barras de herramientas. La propuesta de Google sugiere otro enfoque: simplemente señalar algo y decirle a la IA qué quieres hacer.
En lugar de navegar por interfaces complejas o escribir instrucciones largas, el usuario podría usar comandos cortos como “arregla esto”, “compara estos” o “resume esto”, mientras la IA interpreta el contexto alrededor del cursor.
Si este enfoque llegará a ser lo suficientemente fiable para el uso cotidiano todavía está por verse. Pero marca un cambio importante en cómo las empresas tecnológicas están replanteando la relación entre la inteligencia artificial y la interfaz de usuario.
Comments
0 comments