Demis Hassabis, CEO de Google DeepMind, es tajante:
Demis Hassabis

Para Demis Hassabis, CEO de Google DeepMind y una de las mentes más brillantes de nuestro tiempo, la verdadera revolución de la IA aun está por llegar

El ritmo de innovación en DeepMind es tan frenético que, según Hassabis, están «lanzando algo nuevo cada día», con proyectos que van desde modelos matemáticos de nivel olímpico hasta sistemas de razonamiento complejo. Pero todos estos avances apuntan hacia un mismo y ambicioso objetivo.

De los modelos que «hablan» a los modelos que «piensan»

Para Hassabis, la era de los chatbots que simplemente dan respuestas instantáneas está dando paso a algo mucho más potente: los «modelos de pensamiento». El mejor ejemplo es Deep Think, un sistema de IA que, inspirado en los legendarios AlphaGo y AlphaZero, es capaz de planificar, razonar y refinar sus ideas antes de actuar.

«Los problemas difíciles en matemáticas, programación y ciencia necesitan un pensamiento iterativo», explica. Su nueva IA puede explorar múltiples soluciones en paralelo y luego elegir la mejor, un proceso mucho más cercano al pensamiento humano que la simple respuesta automática de un chatbot convencional.

Genie 3 y la obsesión por crear un «modelo del mundo»

El siguiente y más espectacular paso en esta evolución es Genie 3, un modelo capaz de generar mundos interactivos y consistentes a partir de una simple descripción de texto. Pero Genie no es solo un generador de videojuegos; es parte de un esfuerzo mucho mayor por construir un «modelo del mundo», una IA que entienda las reglas de la física y el espacio que nos rigen.

«Entender la física y el espacio permite un razonamiento que va más allá del lenguaje», afirma la compañía. Esta capacidad es crucial y desbloqueará aplicaciones que hoy nos parecen de ciencia ficción, como robots que puedan interactuar con el mundo real de forma segura, asistentes inmersivos y, en general, una IA capaz de actuar en nuestro entorno físico.

El objetivo final: un «omni-modelo» que lo domine todo

Hoy en día, DeepMind tiene sistemas especializados para cada tarea: Gemini para el lenguaje, Veo para el vídeo, Genie para los mundos virtuales… Pero el objetivo final, según Hassabis, es unificarlo todo en un único «omni-modelo». Una sola y coherente inteligencia artificial que domine todas las modalidades a la vez: lenguaje, razonamiento, visión, vídeo y física.

Google News Portal Innova
Síguenos en Google Noticias

Equipo Prensa
Portal Innova