Google tiene una tecnología capaz de mejorar fotografías que parece sacada de la ciencia ficción

Reescalado de imágenes por IA de Google

Google

  • Google ha mostrado una tecnología para mejorar fotografías que parece de ciencia ficción. 
  • Su funcionamiento es simple: entrenan a una IA con aprendizaje automático para convertir una foto de baja resolución en una foto detallada de alta resolución y los cambios entre una y otra son espectaculares. 
  • Descubre más historias en Business Insider España

Pronto, cualquier foto que tengas en casa con una resolución mediocre y poco detallada tendrá una segunda vida. 

Así al menos se percibe de la nueva tecnología de Google que hace un reescalado de imagen que parece de ciencia ficción. 

En un post del blog de la compañía titulado Generación de imágenes de alta fidelidad mediante modelos de difusión del que se hace eco Petapixel, la compañía americana comparte los avances logrados en la superresolución de imágenes y los resultados son asombrosos. 

Su funcionamiento es simple: entrenan a una IA con aprendizaje automático para convertir una foto de baja resolución en una foto detallada de alta resolución y los cambios entre una y otra son espectaculares. 

Reescalado de imágenes por IA de Google

Google

Google ha estado explorando un concepto llamado "modelos de difusión" del que ya habló por primera vez en 2015 y ahora ha dado un salto de calidad total gracias a métodos de aprendizaje profundo llamados "modelos generativos profundos" con los que generan imágenes con resultados sorprendentes. 

El primer enfoque lleva por nombre SR3 o superresolución mediante refinamiento repetido y explican cómo funciona

"SR3 es un modelo de difusión de superresolución que toma como entrada una imagen de baja resolución y crea una imagen de alta resolución correspondiente a partir de ruido puro", escribe Google. "El modelo se entrena en un proceso de corrupción de imagen en el que el ruido se agrega progresivamente a una imagen de alta resolución hasta que solo queda ruido puro".

Reescalado de imágenes por IA de Google

Google

"Luego aprende a revertir este proceso, comenzando con ruido puro y eliminando progresivamente el ruido para alcanzar una distribución objetivo a través de la guía de la imagen de entrada de baja resolución".

Durante el proceso, han averiguado que SR3 funciona bien en la mejora de retratos e imágenes naturales. Al hacer un aumento de escala de 8x en las caras, logran una "tasa de confusión" de casi el 50% —frente al 34% actual— lo que quiere decir que logra resultados fotorrealistas. 

Con los efectivos resultados en la mano, Google dio el segundo paso: un enfoque llamado CDM, un modelo de difusión condicional de clase. 

"CDM es un modelo de difusión condicional de clase entrenado en datos de ImageNet para generar imágenes naturales de alta resolución", escribe Google. 

Reescalado de imágenes por IA de Google

Google

"Dado que ImageNet es un conjunto de datos difícil y de alta entropía, creamos CDM como una cascada de múltiples modelos de difusión. Este enfoque en cascada implica encadenar varios modelos generativos en varias resoluciones espaciales: un modelo de difusión que genera datos a baja resolución, seguido de una secuencia de modelos de difusión de superresolución SR3 que aumentan gradualmente la resolución de la imagen generada a la resolución más alta". 

Google ha mostrado una serie de ejemplos de cómo han cambiado fotos de baja resolución de 32x32 y cómo va mejorando hasta los 256x256 e incluso a 1024x1024. 

Los resultados son simplemente espectaculares a pesar de que tienen algunos fallos si te fijas bien en una segunda pasada, pero si lo ves por primera vez, pasarían por fotografías originales. 

"Con SR3 y CDM, hemos llevado el rendimiento de los modelos de difusión al estado de la técnica en los puntos de referencia de generación de ImageNet de superresolución y condicional de clase", escriben los investigadores de Google.

 "Estamos entusiasmados de probar aún más los límites de los modelos de difusión para una amplia variedad de problemas de modelado generativo".

Conoce cómo trabajamos en BusinessInsider.

Etiquetas: fotografia, Google