RM新时代专业团队,RM新时代|官方理财平台

生成對抗網(wǎng)絡(luò) (GAN) 是深度學習中最有趣、最受歡迎的應用之一。本文列出了 10 篇關(guān)于 GAN 的論文，這些論文將為你提供一個很好的對 GAN 的介紹，幫助你理解最先進技術(shù)的基礎(chǔ)。

本文選擇的10篇GAN論文包括：

DCGANs

Improved Techniques for Training GANs

Conditional GANs

Progressively Growing GANs

BigGAN

StyleGAN

CycleGAN

Pix2Pix

StackGAN

Generative Adversarial Networks

DCGANs?—?Radford et al.(2015)

我建議你以DCGAN這篇論文來開啟你的GAN之旅。這篇論文展示了卷積層如何與GAN一起使用，并為此提供了一系列架構(gòu)指南。這篇論文還討論了GAN特征的可視化、潛在空間插值、利用判別器特征來訓練分類器、評估結(jié)果等問題。所有這些問題都必然會出現(xiàn)在你的GAN研究中。

總之，DCGAN論文是一篇必讀的GAN論文，因為它以一種非常清晰的方式定義架構(gòu)，因此很容易從一些代碼開始，并開始形成開發(fā)GAN的直覺。

DCGAN模型：具有上采樣卷積層的生成器架構(gòu)

論文：

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

Alec Radford, Luke Metz, Soumith Chintala

https://arxiv.org/abs/1511.06434

改進GAN訓練的技術(shù)——?Salimans et al.(2016)

這篇論文(作者包括Ian Goodfellow)根據(jù)上述DCGAN論文中列出的架構(gòu)指南，提供了一系列建議。這篇論文將幫助你了解GAN不穩(wěn)定性的最佳假設(shè)。此外，本文還提供了許多用于穩(wěn)定DCGAN訓練的其他機器，包括特征匹配、minibatch識別、歷史平均、單邊標簽平滑和虛擬批標準化。使用這些技巧來構(gòu)建一個簡單的DCGAN實現(xiàn)是一個很好的練習，有助于更深入地了解GAN。

論文：

Improved Techniques for Training GANs

Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chen

https://arxiv.org/abs/1606.03498

Conditional GANs?—?Mirza and Osindero(2014)

這是一篇很好的論文，讀起來很順暢。條件GAN(Conditional GAN)是最先進的GAN之一。論文展示了如何整合數(shù)據(jù)的類標簽，從而使GAN訓練更加穩(wěn)定。利用先驗信息對GAN進行調(diào)節(jié)這樣的概念，在此后的GAN研究中是一個反復出現(xiàn)的主題，對于側(cè)重于image-to-image或text-to-image的論文尤其重要。

Conditional GAN架構(gòu)：除了隨機噪聲向量z之外，類標簽y被連接在一起作為網(wǎng)絡(luò)的輸入

論文：

Conditional Generative Adversarial Nets

Mehdi Mirza, Simon Osindero

https://arxiv.org/abs/1411.1784

Progressively Growing GANs—?Karras et al.(2017)

Progressively Growing GAN (PG-GAN)有著驚人的結(jié)果，以及對GAN問題的創(chuàng)造性方法，因此也是一篇必讀論文。

這篇GAN論文來自NVIDIA Research，提出以一種漸進增大（progressive growing）的方式訓練GAN，通過使用逐漸增大的GAN網(wǎng)絡(luò)（稱為PG-GAN）和精心處理的CelebA-HQ數(shù)據(jù)集，實現(xiàn)了效果令人驚嘆的生成圖像。作者表示，這種方式不僅穩(wěn)定了訓練，GAN生成的圖像也是迄今為止質(zhì)量最好的。

它的關(guān)鍵想法是漸進地增大生成器和鑒別器：從低分辨率開始，隨著訓練的進展，添加新的層對越來越精細的細節(jié)進行建模?！癙rogressive Growing”指的是先訓練4x4的網(wǎng)絡(luò)，然后訓練8x8，不斷增大，最終達到1024x1024。這既加快了訓練速度，又大大穩(wěn)定了訓練速度，并且生成的圖像質(zhì)量非常高。

Progressively Growing GAN的多尺度架構(gòu)，模型從4×4 逐步增大到1024×1024

論文：

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen

https://arxiv.org/abs/1710.10196

BigGAN?—?Brock et al.(2019)

BigGAN模型是基于ImageNet生成圖像質(zhì)量最高的模型之一。該模型很難在本地機器上實現(xiàn)，而且BigGAN有許多組件，如Self-Attention、Spectral Normalization和帶有投影鑒別器的cGAN，這些組件在各自的論文中都有更好的解釋。不過，這篇論文對構(gòu)成當前最先進技術(shù)水平的基礎(chǔ)論文的思想提供了很好的概述，因此非常值得閱讀。

BigGAN生成的圖像

論文：

Large Scale GAN Training for High Fidelity Natural Image Synthesis

Andrew Brock, Jeff Donahue, Karen Simonyan

https://arxiv.org/abs/1809.11096

StyleGAN?—?Karras et al.(2019)

StyleGAN模型可以說是最先進的，特別是利用了潛在空間控制。該模型借鑒了神經(jīng)風格遷移中一種稱為自適應實例標準化(AdaIN)的機制來控制潛在空間向量z。映射網(wǎng)絡(luò)和AdaIN條件在整個生成器模型中的分布的結(jié)合使得很難自己實現(xiàn)一個StyleGAN，但它仍是一篇很好的論文，包含了許多有趣的想法。

StyleGAN架構(gòu)，允許潛在空間控制

論文：

A Style-Based Generator Architecture for Generative Adversarial Networks

Tero Karras, Samuli Laine, Timo Aila

https://arxiv.org/abs/1812.04948

CycleGAN?—?Zhu et al.(2017)

CycleGAN的論文不同于前面列舉的6篇論文，因為它討論的是image-to-image的轉(zhuǎn)換問題，而不是隨機向量的圖像合成問題。CycleGAN更具體地處理了沒有成對訓練樣本的image-to-image轉(zhuǎn)換的情況。然而，由于Cycle-Consistency loss公式的優(yōu)雅性，以及如何穩(wěn)定GAN訓練的啟發(fā)性，這是一篇很好的論文。CycleGAN有很多很酷的應用，比如超分辨率，風格轉(zhuǎn)換，例如將馬的圖像變成斑馬。

Cycle Consistency Loss背后的主要想法，一個句子從法語翻譯成英語，再翻譯回法語，應該跟原來的是同一個句子

論文：

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros

https://arxiv.org/abs/1703.10593

Pix2Pix?—?Isola et al.(2016)

Pix2Pix是另一種圖像到圖像轉(zhuǎn)換的GAN模型。該框架使用成對的訓練樣本，并在GAN模型中使用多種不同的配置。讀這篇論文時，我覺得最有趣部分是關(guān)于PatchGAN的討論。PatchGAN通過觀察圖像的70×70的區(qū)域來判斷它們是真的還是假的，而不是查看整個圖像。該模型還展示了一個有趣的U-Net風格的生成器架構(gòu)，以及在生成器模型中使用ResNet風格的skip connections。Pix2Pix有很多很酷的應用，比如將草圖轉(zhuǎn)換成逼真的照片。

使用成對的訓練樣本進行Image-to-Image轉(zhuǎn)換

論文：

Image-to-Image Translation with Conditional Adversarial Networks

Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

https://arxiv.org/abs/1611.07004

StackGAN?—?Zhang et al.(2017)

StackGAN的論文與本列表中的前幾篇論文相比非常不同。它與Conditional GAN和Progressively Growing GANs最為相似。StackGAN模型的工作原理與Progressively Growing GANs相似，因為它可以在多個尺度上工作。StackGAN首先輸出分辨率為64×64的圖像，然后將其作為先驗信息生成一個256×256分辨率的圖像。

StackGAN是從自然語言文本生成圖像。這是通過改變文本嵌入來實現(xiàn)的，以便捕獲視覺特征。這是一篇非常有趣的文章，如果StyleGAN中顯示的潛在空間控制與StackGAN中定義的自然語言接口相結(jié)合，想必會非常令人驚訝。

基于文本嵌入的StackGAN多尺度架構(gòu)背后的想法

論文：

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxas

https://arxiv.org/abs/1612.03242

Generative Adversarial Networks?—?Goodfellow et al.(2014)

Ian Goodfellow的原始GAN論文對任何研究GAN的人來說都是必讀的。這篇論文定義了GAN框架，并討論了“非飽和”損失函數(shù)。論文還給出了最優(yōu)判別器的推導，這是近年來GAN論文中經(jīng)常出現(xiàn)的一個證明。論文還在MNIST、TFD和CIFAR-10圖像數(shù)據(jù)集上對GAN的有效性進行了實驗驗證。

論文：

Generative Adversarial Networks

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

https://arxiv.org/abs/1406.2661

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

GaN

GaN

+關(guān)注

關(guān)注
19

文章
1933

瀏覽量
73286
生成器

生成器

+關(guān)注

關(guān)注
7

文章
315

瀏覽量
21002
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24689

原文標題：必讀！生成對抗網(wǎng)絡(luò)GAN論文TOP 10

文章出處：【微信號：aicapital，微信公眾號：全球人工智能】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

直流變頻焊接控制器：先進技術(shù)在焊接領(lǐng)域的革新應用探索

在當今的工業(yè)生產(chǎn)領(lǐng)域中，新技術(shù)的發(fā)展與應用始終是推動產(chǎn)業(yè)升級、提升效率的關(guān)鍵驅(qū)動力。其中，直流變頻焊接控制器作為一種前沿技術(shù)，在焊接工藝中的革新性應用引起了廣泛關(guān)注。本文將深入探討這一先進技術(shù)

發(fā)表于 12-06 09:07 ?72次閱讀

庫克稱iPhone16是最先進的iPhone

最新款iPhone、Watch和AirPods，最大的亮點估計在人工智能。所以庫克稱iPhone16是最先進的iPhone。庫克表示。iPhone 16 系列是我們打造的最先進的 iPhone。得益于

發(fā)表于 09-10 11:47 ?808次閱讀

NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列，該系列包含最先進的指導和獎勵模型，以及一個用于生成式 AI 訓練的數(shù)據(jù)集。

發(fā)表于 09-06 14:59 ?301次閱讀

NVIDIA Nemotron-4 340B模型<b class='flag-5'>幫助</b>開發(fā)者<b class='flag-5'>生成</b>合成訓練數(shù)據(jù)

憶聯(lián)以完善的產(chǎn)品矩陣與先進技術(shù)為AI PC助力

未來10年，AI產(chǎn)業(yè)將迎來快速發(fā)展期，尤其對于生成式AI（Generative AI）來說，其技術(shù)發(fā)展和應用將加速向端、邊、云、網(wǎng)、智（即終端、邊緣計算、云計算、網(wǎng)絡(luò)和智能應用）等各個

發(fā)表于 09-02 11:39 ?441次閱讀

憶聯(lián)以完善的產(chǎn)品矩陣與<b class='flag-5'>先進技術(shù)</b>為AI PC助力

首屆人工智能先進技術(shù)成果供需對接大會硬核又新潮！

在各類人工智能技術(shù)及應用不斷融入人們?nèi)粘Ｉ畹漠斚?，大會聚?b class='flag-5'>先進技術(shù)、終端消費、行業(yè)應用以及綿陽本地創(chuàng)新產(chǎn)品，將一批“人工智能+”創(chuàng)新應用最新成果、應用場景搬到“會場”，讓你沉浸式體驗AI世界，感受未來已來。

發(fā)表于 07-25 17:04 ?469次閱讀

首屆人工智能<b class='flag-5'>先進技術(shù)</b>成果供需對接大會硬核又新潮！

生成對抗網(wǎng)絡(luò)(GANs)的原理與應用案例

生成對抗網(wǎng)絡(luò)（Generative Adversarial Networks，GANs）是一種由蒙特利爾大學的Ian Goodfellow等人在2014年提出的深度學習算法。GANs通過構(gòu)建兩個

發(fā)表于 07-09 11:34 ?988次閱讀

格芯收購 Tagore Technology 的 GaN 技術(shù)

來源：Silicon Semiconductor 此次技術(shù)收購擴展了 GF（格芯）的電源管理解決方案和差異化路線圖。 GlobalFoundries （格芯）收購了 Tagore

發(fā)表于 07-08 12:33 ?462次閱讀

神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

、語音識別、自然語言處理等多個領(lǐng)域。本文將對幾種主要的神經(jīng)網(wǎng)絡(luò)架構(gòu)進行詳細介紹，包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、生成對抗

發(fā)表于 07-01 14:16 ?693次閱讀

瑞薩電子完成對Transphorm的收購，加速GaN技術(shù)布局

在全球半導體技術(shù)競爭日益激烈的今天，瑞薩電子以其前瞻性的戰(zhàn)略眼光和果斷的行動，成功完成了對氮化鎵（GaN）器件商Transphorm的收購，收購價高達3.39億美元。這一交易的完成，不僅標志著瑞薩電子在GaN

發(fā)表于 06-25 10:07 ?546次閱讀

TüV萊茵舉辦光儲充先進技術(shù)研討會，攜手行業(yè)伙伴共創(chuàng)綠色未來

深圳2024年6月3日?/美通社/ -- 5月30日-31日，國際獨立第三方檢測、檢驗和認證機構(gòu)德國萊茵TüV大中華區(qū)(以下簡稱"TüV萊茵")在深圳舉辦光儲充先進技術(shù)研討會。深圳市市場監(jiān)督管理

發(fā)表于 06-04 15:11 ?349次閱讀

TüV萊茵舉辦光儲充<b class='flag-5'>先進技術(shù)</b>研討會，攜手行業(yè)伙伴共創(chuàng)綠色未來

思科完成對Isovalent的收購

全球領(lǐng)先的網(wǎng)絡(luò)技術(shù)公司思科(Cisco)近日宣布，已完成對開源云原生網(wǎng)絡(luò)與安全領(lǐng)域的佼佼者Isovalent的收購。

發(fā)表于 05-06 10:41 ?628次閱讀

深度學習生成對抗網(wǎng)絡(luò)（GAN）全解析

GANs真正的能力來源于它們遵循的對抗訓練模式。生成器的權(quán)重是基于判別器的損失所學習到的。因此，生成器被它生成的圖像所推動著進行訓練，很難知道生成

發(fā)表于 03-29 14:42 ?4516次閱讀

生成式人工智能和感知式人工智能的區(qū)別

生成新的內(nèi)容和信息的人工智能系統(tǒng)。這些系統(tǒng)能夠利用已有的數(shù)據(jù)和知識來生成全新的內(nèi)容，如圖片、音樂、文本等。生成式人工智能通?；谏疃葘W習技術(shù)，如生成

發(fā)表于 02-19 16:43 ?1726次閱讀

AI克隆技術(shù)可用于創(chuàng)建虛擬人物形象！它的技術(shù)原理和發(fā)展趨勢

和行為特點等。 ? AI克隆技術(shù)的原理及應用 ? AI克隆技術(shù)的原理主要是通過人工智能技術(shù)來模擬和復制真實人類的行為、思維和表情等。具體來說，AI克隆技術(shù)通常涉及到深度學習和

發(fā)表于 01-08 08:28 ?2738次閱讀

基于國產(chǎn)AI編譯器ICRAFT部署YOLOv5邊緣端計算的實戰(zhàn)案例

人工智能領(lǐng)域中各種算法模型的不斷研究和改進。隨著深度學習的興起，包括卷積神經(jīng)網(wǎng)絡(luò)（CNN）、循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）、生成對抗網(wǎng)絡(luò)（GAN）、

發(fā)表于 01-03 10:17 ?3081次閱讀

RM新时代网站-首页

搜索歷史

生成對抗網(wǎng)絡(luò)GAN論文TOP 10，幫助你理解最先進技術(shù)的基礎(chǔ)

評論