GauGAN, la herramienta creada por Nvidia, es capaz de convertir palabras en imágenes realistas mediante la inteligencia artificial

23 nov. 2021 15:20h.

GauGAN, un software desarrollado por Nvidia, permite generar imágenes realistas en tiempo real a partir de un frase escrita por el usuario.
Esta tecnología utiliza la inteligencia artificial (IA) para modificar lo que se ve de forma instantánea.
Descubre más historias en Business Insider España.

GauGAN, un software desarrollado por Nvidia, permite generar imágenes realistas en tiempo real a partir de un frase escrita por el usuario gracias a la inteligencia artificial (IA), tal y como recoge Techeblog.

El medio explica que esta herramienta hace posible el deseo futurista de trasladar un pensamiento a la realidad.

Los autores señalan que su utilización es bastante sencilla, ya que tan solo habrá que escribir una frase que describa la escena que se desee mostrar e ir agregando adjetivos o intercambiando palabras para que se adapte lo más posible a lo que se desea conseguir.

El modelo de deep learning que sostiene GauGAN irá modificando lo que se ve de forma instantánea.

Además, la misma fuente apunta que los usuarios podrán generar un mapa de segmentación tan solo presionando un botón, lo que da forma a un esquema de alto nivel que representa la ubicación de los objetos en la escena.

Esta herramienta, cuyo nombre hace referencia al pintor francés Gauguin, avanza las posibilidades que ofrecen las herramientas de generación de imágenes en un futuro para los artistas.

Nvidia presentó esta tecnología en el marco de la GPU Technology Conference (GTC) en 2019.

Entonces, explicaron que el software, basado en el uso de redes generativas antagónicas (GANs), utilizaba una técnica denominada "normalización espacialmente adaptativa", capaz de generar imágenes fotorrealistas a partir de un determinado diseño semántico controlado por el usuario, tal y como recuerdan desde Xataka.

Dicho medio recogió en ese momento las declaraciones de Bryan Catanzaro, vicepresidente de Investigación aplicada al deep learning de Nvidia, que comparó el mencionado software con un pincel inteligente capaz de rellenar los datos dentro de mapas de segmentación en bruto.

De esta forma, "es el usuario el que delimita en cada momento qué área ocupará el cielo, qué parte del mismo estará ocupado por nubes, dónde hay praderas, ríos y montañas".

Sherpa.ai, la empresa española capaz de ofrecer soluciones de inteligencia artificial "sin límites" respetando las leyes de protección de datos

El directivo de la compañía explicaba a la misma fuente que esta tecnología "no se limita a unir piezas de otras imágenes, o a cortar y pegar texturas", sino que "sintetiza nuevas imágenes, de manera muy similar al modo en en que un artista dibujaría algo".

Catanzaro ya avanzaba en ese momento que GauGAN podría convertirse en una herramienta de muchísima utilidad para la creación de mundos virtuales.

Entre las profesiones que más podrían recurrir a ella mencionó algunas como planificadores urbanos, diseñadores de paisaje o creadores de videojuegos.

El vicepresidente de investigación aplicada al deep learning de Nvidia explicó que estos profesionales podrían utilizar el software para realizar cambios rápidos en escenas artificiales y mejorar ideas de prototipos.

"Es mucho más cómodo que intercambiar ideas recurriendo a simples bocetos", precisó.

Conoce cómo trabajamos en BusinessInsider.

Etiquetas: Inteligencia artificial

Otros artículos interesantes: