La fulgurante progression de la synthèse d’images de réseaux neuronaux

Les recherches de @nvidia ont porté la synthèse d’images de réseaux neuronaux à une définition visuelle beaucoup plus élevée qu’auparavant:

La vidéo ci-dessous n’ a pas d’audio et les résultats de l’exemple démarre environ 38 secondes après:

Nous décrivons une nouvelle méthodologie de formation pour les réseaux de confrontation. L’idée principale est de faire croître le générateur et le discriminateur progressivement, en commençant par les images à basse résolution, et d’ajouter de nouvelles couches qui traitent les détails à plus haute résolution au fur et à mesure que l’entraînement progresse. Ceci stabilise considérablement la formation et nous permet de produire des images d’une qualité sans précédent, par exemple des images CelebA à une résolution de 1024². Nous proposons également une façon simple d’augmenter la variation dans les images générées, et d’atteindre un score record de 8,80 en CIFAR10. De plus, nous décrivons plusieurs petits détails de mise en œuvre qui sont importants pour décourager la concurrence malsaine entre le générateur et le discriminateur. Enfin, nous suggérons une nouvelle métrique pour évaluer les résultats du GAN, tant en termes de qualité d’image que de variation. Comme contribution additionnelle, nous construisons une version de qualité supérieure de l’ensemble de données CelebA qui permet une exploration significative jusqu’ à la résolution de 1024² pixels.

Source: research.nvidia.com

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.