✨︎ Resumen (TL;DR):
- Google DeepMind presentó un cursor inteligente capaz de interpretar visualmente cualquier elemento de la pantalla.
- La función ya está en fase experimental para Chrome de escritorio y en Google AI Studio.
- La herramienta operará en todo el sistema operativo de las nuevas Googlebook de Acer, Asus y Dell.
Google DeepMind presentó este lunes Magic Pointer durante The Android Show: I/O Edition. Se trata de un cursor impulsado por Gemini capaz de interpretar el contexto visual y semántico de la computadora en tiempo real. La herramienta elimina la necesidad de redactar prompts complejos y ya comenzó su despliegue para la versión de escritorio de Chrome.
Magic Pointer es una función de análisis contextual que permite a Gemini identificar lo que el usuario señala y entender la acción deseada sin abrir ventanas de chat separadas. Los investigadores de DeepMind, Adrien Baranes y Rob Marchant, explicaron que el sistema prioriza mantener el flujo de trabajo activo con comandos directos como “arregla esto” o “mueve eso aquí”.
“Simplemente señala, y la IA sabe exactamente con qué palabra, párrafo, parte de una imagen o bloque de código necesita ayuda el usuario”, escribió el equipo de DeepMind en su blog oficial.
El desarrollo convierte los píxeles de la pantalla en datos estructurados (fechas, lugares, objetos). Los usuarios en Chrome ya pueden seleccionar productos de una página web y pedirle a la IA que los compare, o señalar un punto en la foto de una habitación para visualizar muebles nuevos.

El ecosistema Googlebook y el desafío de la privacidad
La integración más profunda de este cursor llegará con las Googlebook, una nueva familia de laptops basadas en tecnología Android y Gemini Intelligence. Socios de hardware como Acer, Asus y Dell enviarán los primeros equipos a finales de este año.
En estas computadoras, el puntero funcionará en todo el sistema operativo. Seleccionar una fecha en un correo electrónico registrará automáticamente un evento en el calendario. Para mitigar preocupaciones sobre privacidad, el hardware incluirá una barra luminosa en el chasis que parpadeará cuando la IA esté activa.
El análisis constante de la pantalla ha generado comparaciones directas con Microsoft Recall, la función de captura de pantalla que enfrentó quejas masivas por posibles riesgos de vigilancia. Por ahora, Google no ha detallado sus políticas de retención y procesamiento de datos.
Las pruebas iniciales de la prensa especializada muestran resultados mixtos. El sitio PCWorld probó los demos y reportó que la tecnología “muestra potencial pero sigue siendo torpe y limitada”. Por su parte, Android Authority advirtió que el despliegue inicial avanza de forma lenta y muchos usuarios todavía no tienen acceso.
