Redes Generativas Adversarias (GANs) - Marco de Aprendizaje Profundo

Resumen

Proponemos un nuevo marco para estimar modelos generativos mediante un proceso adversarial, en el cual entrenamos simultáneamente dos modelos: un modelo generativo G que captura la distribución de datos, y un modelo discriminativo D que estima la probabilidad de que una muestra provenga de los datos de entrenamiento en lugar de G. El procedimiento de entrenamiento para G consiste en maximizar la probabilidad de que D cometa un error. Este marco corresponde a un juego minimax de dos jugadores.

En el espacio de funciones arbitrarias G y D, existe una solución única, donde G recupera la distribución de datos de entrenamiento y D es igual a 1/2 en todas partes. Cuando G y D están definidos por perceptrones multicapa, todo el sistema puede entrenarse con retropropagación. No se necesitan cadenas de Markov ni redes de inferencia aproximada desplegadas durante el entrenamiento o la generación de muestras. Los experimentos demuestran el potencial del marco mediante evaluación cualitativa y cuantitativa de las muestras generadas.

1. Introducción

La promesa del aprendizaje profundo es descubrir modelos jerárquicos ricos que representen distribuciones de probabilidad sobre los tipos de datos encontrados en aplicaciones de inteligencia artificial, como imágenes naturales, formas de onda de audio que contienen voz y símbolos en corpus de lenguaje natural. Hasta ahora, los éxitos más notorios en aprendizaje profundo han involucrado modelos discriminativos, generalmente aquellos que mapean una entrada sensorial rica y de alta dimensión a una etiqueta de clase. Estos éxitos notables se han basado principalmente en los algoritmos de retropropagación y abandono, utilizando unidades lineales por tramos que tienen un gradiente particularmente bien comportado.

Los modelos generativos profundos han tenido menor impacto, debido a la dificultad de aproximar muchas computaciones probabilísticas intratables que surgen en la estimación de máxima verosimilitud y estrategias relacionadas, y debido a la dificultad de aprovechar los beneficios de las unidades lineales por tramos en el contexto generativo. Proponemos un nuevo procedimiento de estimación de modelos generativos que elude estas dificultades.

La Analogía del Falsificador-Policía

En el marco de redes adversariales propuesto, el modelo generativo se enfrenta a un adversario: un modelo discriminativo que aprende a determinar si una muestra proviene de la distribución del modelo o de la distribución de datos. El modelo generativo puede considerarse análogo a un equipo de falsificadores, que intenta producir moneda falsa y usarla sin ser detectado, mientras que el modelo discriminativo es análogo a la policía, que intenta detectar la moneda falsificada. La competencia en este juego impulsa a ambos equipos a mejorar sus métodos hasta que las falsificaciones sean indistinguibles de los artículos genuinos.

Este marco puede producir algoritmos de entrenamiento específicos para muchos tipos de modelos y algoritmos de optimización. En este artículo, exploramos el caso especial cuando el modelo generativo genera muestras pasando ruido aleatorio a través de un perceptrón multicapa, y el modelo discriminativo también es un perceptrón multicapa. Nos referimos a este caso especial como redes adversariales. En este caso, podemos entrenar ambos modelos utilizando únicamente los altamente exitosos algoritmos de retropropagación y abandono, y muestrear del modelo generativo usando solo propagación hacia adelante. No son necesarias inferencias aproximadas ni cadenas de Markov.

2. Trabajos Relacionados

Una alternativa a los modelos gráficos dirigidos con variables latentes son los modelos gráficos no dirigidos con variables latentes, como las máquinas de Boltzmann restringidas (RBM), las máquinas de Boltzmann profundas (DBM) y sus numerosas variantes. Las interacciones dentro de tales modelos se representan como el producto de funciones de potencial no normalizadas, normalizadas por una suma/integración global sobre todos los estados de las variables aleatorias.

Esta cantidad (la función de partición) y su gradiente son intratables para todos excepto los casos más triviales, aunque pueden estimarse mediante métodos de Monte Carlo con cadenas de Markov (MCMC). La mezcla plantea un problema significativo para los algoritmos de aprendizaje que dependen de MCMC.

Redes de Creencia Profunda (DBN)

Las redes de creencia profunda (DBN) son modelos híbridos que contienen una sola capa no dirigida y varias capas dirigidas. Si bien existe un criterio de entrenamiento aproximado rápido por capas, las DBN conllevan las dificultades computacionales asociadas tanto con modelos no dirigidos como dirigidos.

Criterios Alternativos

Criterios alternativos que no aproximan ni acotan