Redes Generativas Adversarias: Un Marco Revolucionario para el Aprendizaje Profundo
Departamento de Informática e Investigación Operativa, Universidad de Montreal, Montreal, QC H3C 3J7
Resumen
Proponemos un nuevo marco para estimar modelos generativos mediante un proceso adversarial, en el cual entrenamos simultáneamente dos modelos: un modelo generativo G que captura la distribución de datos, y un modelo discriminativo D que estima la probabilidad de que una muestra provenga de los datos de entrenamiento en lugar de G. El procedimiento de entrenamiento para G consiste en maximizar la probabilidad de que D cometa un error. Este marco corresponde a un juego minimax de dos jugadores.
En el espacio de funciones arbitrarias G y D, existe una solución única, donde G recupera la distribución de datos de entrenamiento y D es igual a 1/2 en todas partes. Cuando G y D están definidos por perceptrones multicapa, todo el sistema puede entrenarse con retropropagación. No se necesitan cadenas de Markov ni redes de inferencia aproximada desplegadas durante el entrenamiento o la generación de muestras. Los experimentos demuestran el potencial del marco mediante evaluación cualitativa y cuantitativa de las muestras generadas.
1. Introducción
La promesa del aprendizaje profundo es descubrir modelos jerárquicos ricos que representen distribuciones de probabilidad sobre los tipos de datos encontrados en aplicaciones de inteligencia artificial, como imágenes naturales, formas de onda de audio que contienen voz y símbolos en corpus de lenguaje natural. Hasta ahora, los éxitos más notorios en aprendizaje profundo han involucrado modelos discriminativos, generalmente aquellos que mapean una entrada sensorial rica y de alta dimensión a una etiqueta de clase. Estos éxitos notables se han basado principalmente en los algoritmos de retropropagación y abandono, utilizando unidades lineales por tramos que tienen un gradiente particularmente bien comportado.
Los modelos generativos profundos han tenido menor impacto, debido a la dificultad de aproximar muchas computaciones probabilísticas intratables que surgen en la estimación de máxima verosimilitud y estrategias relacionadas, y debido a la dificultad de aprovechar los beneficios de las unidades lineales por tramos en el contexto generativo. Proponemos un nuevo procedimiento de estimación de modelos generativos que elude estas dificultades.
La Analogía del Falsificador-Policía
En el marco de redes adversariales propuesto, el modelo generativo se enfrenta a un adversario: un modelo discriminativo que aprende a determinar si una muestra proviene de la distribución del modelo o de la distribución de datos. El modelo generativo puede considerarse análogo a un equipo de falsificadores, que intenta producir moneda falsa y usarla sin ser detectado, mientras que el modelo discriminativo es análogo a la policía, que intenta detectar la moneda falsificada. La competencia en este juego impulsa a ambos equipos a mejorar sus métodos hasta que las falsificaciones sean indistinguibles de los artículos genuinos.
Este marco puede producir algoritmos de entrenamiento específicos para muchos tipos de modelos y algoritmos de optimización. En este artículo, exploramos el caso especial cuando el modelo generativo genera muestras pasando ruido aleatorio a través de un perceptrón multicapa, y el modelo discriminativo también es un perceptrón multicapa. Nos referimos a este caso especial como redes adversariales. En este caso, podemos entrenar ambos modelos utilizando únicamente los altamente exitosos algoritmos de retropropagación y abandono, y muestrear del modelo generativo usando solo propagación hacia adelante. No son necesarias inferencias aproximadas ni cadenas de Markov.