El lado más creativo y controversial de la IA
Generative adversarial network (GAN).
-
29 de julio de 2020

En los dos últimos años nos hemos sorprendido por aplicaciones que hacen lo inimaginable. Toman nuestro rostro y lo envejecen, hacen que una fotografía de noche sea cómo tomada de día, nos convierten en un emoji y otros muchos usos. En todas ellas como es de imaginar está la inteligencia artificial, más específicamente un tipo especial de redes neuronales llamadas Red de Confrontación Generativa o su nombre en inglés Generative adversarial network (GAN).
Una red de confrontación generativa ( GAN ) es un tipo de arquitectura de red neuronal para el modelado generativo. La cual fue diseñada por Ian Goodfellow y sus colegas en 2014.
El modelado generativo implica el uso de un modelo para generar nuevos ejemplos que provienen de una distribución existente de muestras, como generar nuevas fotografías que son similares pero específicamente diferentes de un conjunto de datos de fotografías existentes.
Una GAN es un modelo generativo que se entrena utilizando dos modelos de redes neuronales. Un modelo se llama modelo de " generador " o " red generativa " que aprende a generar nuevas muestras plausibles. El otro modelo se llama " discriminador " o " red discriminativa " y aprende a diferenciar ejemplos generados de ejemplos reales.
Los dos modelos se configuran en un concurso o un juego (en el sentido de la teoría de juegos) donde el modelo generador busca engañar al modelo discriminador, y el discriminador se proporciona con ejemplos de muestras reales y generadas.
Después del entrenamiento, el modelo generativo puede usarse para crear nuevas muestras a pedido del usuario.
Traducción de imagen a imagen
Esta es una tarea un poco general, para aquellos documentos que presentan GAN que pueden realizar muchas tareas de traducción de imágenes.
Phillip Isola y col. en su artículo de 2016 titulado " Traducción de imagen a imagen con redes adversas condicionales ", demuestran las GAN, específicamente su enfoque pix2pix para muchas tareas de traducción de imagen a imagen.
Los ejemplos incluyen tareas de traducción como:
Traducción de imágenes semánticas a fotografías de paisajes urbanos y edificios.
Traducción de fotografías satelitales a Google Maps.
Traducción de fotos de día a noche.
Traducción de fotografías en blanco y negro a color.
Traducción de bocetos a fotografías en color.
Ejemplo de bocetos para fotografiar en color con pix2pix. Tomado de la traducción de imagen a imagen con redes adversas condicionales, 2016.
Generar fotografías de rostros humanos
Tero Karras, y col. en su artículo de 2017 titulado " Crecimiento progresivo de GAN para mejorar la calidad, la estabilidad y la variación ", demuestran la generación de fotografías realistas plausibles de rostros humanos. Son tan reales, de hecho, que es justo llamar notable el resultado. Como tal, los resultados recibieron mucha atención de los medios. Las generaciones de caras fueron entrenadas en ejemplos de celebridades, lo que significa que hay elementos de celebridades existentes en las caras generadas, lo que hace que parezcan familiares, pero no del todo.
Ejemplos de caras fotorrealistas generadas por GAN. Tomado del crecimiento progresivo de GAN para mejorar la calidad, la estabilidad y la variación, 2017.
Sus métodos también se utilizaron para demostrar la generación de objetos y escenas.
Un sitio que tienes que ver es https://thispersondoesnotexist.com/ donde en cada refesco o actualización de la página aparece un rostro de una persona que no existe, y que fue generada mediante StyleGAN. Algoritmo creado por la empresa Nvidia.
FaceApp
FaceApp es una aplicación móvil para iOS y Android desarrollada por la empresa rusa Wireless Lab que utiliza inteligencia artificial para generar automáticamente transformaciones de rostros altamente realistas en las fotografías.1 La aplicación puede transformar un rostro para hacerlo sonreír, parecer más joven, parecer mayor o cambiar de sexo.2 FaceApp fue lanzada en iOS en enero de 2017 y en Android en febrero de 2017 y cuenta con una versión gratuita y otra pro.3
Proximos pasos.
Esto no acaba acá, estos son solo algunos de los usos más llamativos de este tipo de redes. Pero en la medida que la técnica siga avanzado y sus usos se vayan combinando vamos a seguir informando sobre nuevas e impresionantes apps que utilizan GAN.