Innovaciones de IA en Google IO 2025

Aquí tienes un resumen completo basado en la información proporcionada en las fuentes sobre las novedades presentadas por Google en el Google I/O:

Las fuentes describen la presentación de Google I/O como un evento donde Google «se ha pasado el juego de la inteligencia artificial», anunciando nueve cosas que, según se dice, han cambiado el mundo de la inteligencia artificial. El objetivo es analizar estas novedades de forma resumida para tener la información clave.

Aquí están los puntos principales:

Project Astra: Este es un asistente personal diseñado por Google para teléfonos móviles, potenciado por inteligencia artificial. Se presentó una evolución que permite compartir la cámara y la pantalla del móvil con la IA para que pueda interactuar con ellas. Aunque esta funcionalidad ya existe en Chat GPT, el avance de Google en esta dirección es significativo. La visión de Google para Project Astra incluye la capacidad de buscar y descargar información de internet, utilizar aplicaciones externas (como buscar y ejecutar un vídeo en YouTube), e incluso realizar llamadas telefónicas con una voz artificial en tiempo real para preguntar información, por ejemplo, sobre stock de un producto. Esto indica un asistente personal «realmente útil». Se encuentra en una fase beta «muy limitada» y se espera que se libere para más personas en los próximos meses, «probablemente después de verano».
Nuevos Modelos de Inteligencia Artificial: Google ha presentado varios modelos nuevos.
- Gemini 2.5 Flash: Se describe como el modelo más rápido y mejorado, posicionado como el segundo mejor modelo del mercado en programación (solo detrás de Gemini 2.5 Pro) y en muchas otras áreas. Destaca por ser uno de los más baratos y considerado el mejor modelo en relación calidad-precio. Se compara con OpenAI O4 Mini, siendo superior en algunas cosas e inferior en otras, pero «muchísimo más barato».
- Modo Deep Thinking: Similar al modo O1 Pro de OpenAI, este modo permite que el modelo «piense» durante más tiempo. Estará disponible para Gemini 2.5 Pro (llamado «Pro 2.5 Deep Thinking»). Se menciona la expectativa sobre su rendimiento comparado con O3 Pro, que se creía que saldría esa semana.
- Modelo de Difusión para LLMs: Google ha presentado un modelo de lenguaje basado en difusión, distinto a los modelos tradicionales que generan «token a token». Este modelo es cinco veces más rápido que el modelo de tokens más rápido de Google, es más pequeño que Flash, tiene «muy buenas puntuaciones» y es «muy muy rápido». Aunque no es útil «hoy», se considera que podría marcar la diferencia en el futuro para crear aplicaciones, código o texto de forma instantánea «con un solo clic».
Funciones Avanzadas en la Aplicación Gemini: Se han añadido dos funciones más avanzadas.
- Canvas: Ahora incluye nuevas funciones para exportar el contenido. Permite convertir resúmenes o documentos creados en Canvas en formatos como una página web, un infográfico, un examen o un podcast de audio. Se demostró la creación de una web interactiva o una infografía a partir de un resumen del Google I/O, destacando la utilidad de convertir documentación o contratos en diferentes formatos usando el «poder computacional y el poder de código de Gemini».
- Deep Research: Esta función permite crear informes sobre información. Google va más allá de la conexión con SharePoint o OneDrive (que ya ofrecía OpenAI). Permite conectar directamente con archivos locales subiendo un archivo para que la IA haga un informe solo sobre su contenido. Próximamente, también permitirá conectarlo con Google Drive y Gmail para crear informes sobre correos electrónicos, por ejemplo.
Integración en el Buscador de Google: Muchas de las funciones de Project Astra y Gemini se integrarán directamente en el buscador de Google. Esto busca asegurar que los usuarios tradicionales de Google no se pierdan y para tranquilizar a los accionistas ante la «amenaza de los RMLMs en los motores de búsqueda». Las funciones mostradas incluyen:
- Probador de ropa virtual (virtual try-on), donde puedes usar una foto tuya para probarte ropa online (disponible solo en Estados Unidos).
- Rastreador de precios (price tracker), que te avisará cuando un producto alcance el precio deseado o menos.
- Modo AI universal en Estados Unidos, que permite interactuar con el buscador como un chatbot, sin depender de preguntas y enlaces azules.
- Personalización de búsquedas basada en la información que Google tiene del usuario (de Gmail, Gemini, etc.), haciendo que los resultados sean más relevantes (por ejemplo, si buscas un restaurante, sabrá si prefieres hamburgueserías o italianos).
Firesat: Un nuevo sistema de satélites desarrollado por Google con cámaras de visión capaces de monitorear incendios forestales en cualquier parte del mundo. El tiempo de respuesta para detectar un fuego se reduce de 12 horas a 20 minutos, lo que se considera un impacto «brutal».
Inteligencia Artificial de Vídeo (Veo) y Editor (Flow):
- Veo: El nuevo modelo de vídeo de Google. Una capacidad destacada es que puede introducir audio y diálogos en la escena de forma nativa. Los resultados se describen como «increíbles». Está incluido dentro de Gemini, pero con ciertas limitaciones en el plan gratuito. Para usar Veo 3, se necesita el Plan Ultra.
- Flow: Un editor de vídeo que sería el equivalente a Sora de Open AI. Permite crear, cortar, expandir vídeos, usar imágenes de referencia, controles de cámara, entre otras funciones. Aunque muchas están actualmente limitadas o no disponibles, se espera que pronto se puedan usar. Flow con Veo 2 está incluido en el plan AI Pro, y Flow con Veo 3 en el plan Ultra.
Planes de Suscripción: La inteligencia artificial se está volviendo «tremendamente cara». Google ha presentado un nuevo plan de suscripción «Ultra».
- Cuenta Gratuita: Acceso limitado a modelos (acceso a 2.5 Pro y 2.5 Flash), Canvas, Gems, Flow (limitado), 15GB de almacenamiento, Notebook LM, WHS (generador de imágenes). Se considera superior al plan gratuito de Open AI.
- AI Pro ($20 al mes, con un mes gratis de prueba): Incluye todo lo del plan gratuito, más acceso a 2.5 Pro y a Veo 2 con el editor Flow.
- Google AI Ultra ($250 al mes, con una promoción inicial de $125 por 3 meses): Es el plan «más caro del mercado». Permite acceder a Veo 3, Project Mariner, incluye YouTube Premium (valorado en 15-20€) y 30TB de almacenamiento. Para usar Veo 3 o el modo Deep Thinking de Gemini, se necesita este plan.
Agentes de Inteligencia Artificial: Se han presentado dos agentes.
- Project Jules: Un agente similar a Codex de Open AI, para programadores, disponible sin coste.
- Project Mariner: Un agente similar a Operator de Open AI, que parece ser «un poco más rápido». Permite que la IA haga cosas por nosotros en su propio ordenador sin usar nuestro dispositivo, como reservar vuelos, hoteles o rellenar formularios usando un navegador. Está disponible con el plan Google AI Ultra.
Gafas de Realidad Aumentada: Google ha presentado unas nuevas gafas con su sistema operativo XR. Son similares a las Ray-Ban Meta, pero con una pantalla dentro de la lente, lo que permite ver información reproducida directamente en el cristal. Las demostraciones mostraron capacidades como identificar grupos musicales basándose en lo que ves, dar instrucciones de GPS, tener «memoria» para recordar escenas vistas anteriormente, y traducción simultánea con subtítulos que aparecen en la pantalla de las gafas. Se describen como «absolutamente normales y corrientes, pequeñas, atractivas, estéticas». A diferencia de las gafas de Meta (descritas como «horribles, enormes y super bulky» y esperadas para 2030 con cristales de 20.000$), las de Google parecían modelos de producción acabados y se espera que estén disponibles «muchísimo antes», quizás en «cuestión de meses o años». Se consideran «una de las cosas más útiles y brutales» presentadas y con potencial para que «todos las llevemos».

En resumen, Google ha presentado una serie de novedades significativas en IA, desde asistentes personales avanzados y nuevos modelos más rápidos y eficientes, hasta integraciones profundas en sus productos existentes (como el buscador y la aplicación Gemini), sistemas de monitoreo ambiental, capacidades de vídeo muy avanzadas, y hardware innovador como las gafas AR. Esto se percibe como un movimiento que «cambia las reglas del juego» y «pone muy difícil a Open AI», mostrando que Google tiene «mucho que decir en el mundo de inteligencia artificial». Sin embargo, se señala que el acceso a las funcionalidades más avanzadas (como Veo 3 o Project Mariner) se está volviendo muy caro, requiriendo suscripciones de alto precio.

Deja un comentario Cancelar respuesta