Pasar al contenido principal

La inteligencia artificial de Google ya puede decirte lo buenas que son tus fotos

Comparación de la foto de una casa procesada con IA
Google

Google ha creado un algoritmo que es capaz de evaluar y decir cómo de buenas son tus fotos.

El gigante de las búsquedas por internet de Mountain View (California, Estados Unidos) publicó la semana pasada una entrada de blog en la que describía el contenido de un artículo científico sobre un sistema de evaluación de imágenes neuronales (NIMA, por sus siglas en inglés).

El sistema usa una red neuronal convolucional profunda (CNN, por sus siglas en inglés) para calificar las fotos según lo que cree que te gustará, tanto técnica como estéticamente.

La red ha sido entrenada con un conjunto de datos de imágenes evaluadas por humanos. El resultado es una inteligencia artificial (IA) que reproduce "de cerca" las puntuaciones medias de los evaluadores humanos.

Tal y como cuentan el ingeniero de software de Google Hossein Talebi y el científico investigador de percepción artificial Peyman Milanfar en el blog de la compañía:

"En "NIMA: evaluación de imágenes neuronales", presentamos una CNN profunda entrenada para predecir qué imágenes escogería un usuario medio como buenas (en el aspecto técnico) y atractivas (en el aspecto estético). NIMA se basa en el éxito de las últimas redes neuronales profundas para el reconocimiento de objetos profundos, lo que le permite comprender categorías generales de objetos a pesar de las múltiples variaciones entre cada elemento.

Nuestra red puede utilizarse no solo para puntuar imágenes de forma fiable y parecida a cómo lo haría un humano, sino también para una serie de tareas más intesas y laboriosas como la edición inteligente de fotos, optimizar la calidad visual para conectar con el usuario y minimizar los errores percibidos en un flujo de procesado de imágenes".

Comparativa de la calidad de una misma imagen procesada con IA
Google

La tecnología aún no está disponible ni en los dispositivos de Google ni en sus navegadores, pero los investigadores explican así la importancia de su trabajo:

"Nuestro trabajo en NIMA sugiere que los modelos de evaluación de la calidad basados ​​en aprendizaje automático o aprendizaje de máquinas pueden ser capaces de una amplia gama de funciones útiles. Por ejemplo, podríamos facilitar a los usuarios encontrar las mejores imágenes entre muchas o, incluso, mejorar su técnica fotográfica con evaluaciones en tiempo real.

En cuanto a la posproducción, estos modelos se pueden utilizar para mejorar los resultados de los sistemas de edición y retoque fotográfico. En este sentido, la red NIMA (y otras similares) pueden actuar como una simulación razonable, aunque imperfecta, del gusto humano para las fotos y probablemente para los vídeos también. Estamos entusiasmados por poder compartir estos resultados, aunque sabemos que la compresión de qué significan la calidad y la estética para la percepción humana es un desafío continuo que implica el replanteamiento y la prueba constante de nuestros modelos".

Te puede interesar