当前位置首页电影《国产免费自拍AV》

《国产免费自拍AV》

类型：科幻武侠微电影地区：俄罗斯年份：2003

更新：2024-10-04 14:34:05

简介：深度学习最强资源推荐：一文看尽GAN的前世今生雷锋网AI科技评论按，生成对抗网络是当前最热门的技术之(zhī )一，它(tā )掀起了一场技术革命，取得了很多重大的突破。不久前，伊利诺伊大学香槟分校的(de )学生(shēng )AjayUppiliArasanipala" />剧情:深度学(🎱)习最强资源推(🙄)荐：一文看尽GAN的前世今生雷锋网AI科技评论按，生成对抗网络是当(🔵)前最热门的技术之(zhī )一，它(💅)(tā )掀起了一场技术革命，取得了很多重大的突破。不久前，伊利诺伊大学香槟分校的(de )学生(shēng )AjayUppiliArasanipala详情

立即播放收藏

剧情简介

深度学习最强资源推荐：一文看尽 GAN 的前世今生

雷锋网 AI 科技评论按，生成对抗网络是当前最热门的技术之(🎑)一，它掀起了一场技术革命，取(🔐)得了很多重大的突破。不久前，伊利诺伊大学香槟分校的学生 Ajay Uppili Arasanipalai 在 Deep Learning 专栏发(🥫)布了一篇文(😓)章，文章详细介绍了 GAN 自被提出以来的发展历史，以及各种相关的论文、(🕞)代码和博客(✅)。雷锋网 AI 科技评论(🤲)将他的文章编译整理如下。

当 Ian Goodfellow 在 2014 年喝了一杯(🛡)啤(🎴)酒之后，在梦中产(⬜)生了「生成对抗网络」（GANs）的想(📆)法时，他可能没想到这一领域进展如(💱)此之(🐮)快：

你可能不知道我要表达什么意思——(😏)其实你刚才(⚓)看到的图片完(📵)全、不可否认、100%…是假的。

此外，我并不(📫)是说，这些图片都是 photoshop、CGI 或用 Nvidia 目前的高级新技术填补空白产生的。

我的意思是，这些图像完全是通过加法、乘(🚑)法在花费了大量 GPU 计算之后(🎃)生成的。

实现这些玩意(💶)儿的(💫)算法被称为生成性对(👠)抗网络，在过去(🔡)几年中，Facebook 致力于生成对抗网络的研究和创新比在隐私保护问题上更多。

2019 年 1 月 15 日，Ian Goodfellow 在 twitter 中表示，过去 4 年半，GAN 在人脸生成方面的进展可以查看下面的资料：

https://t.co/kiQkuYULMC

https://t.co/S4aBsU536b

https://t.co/8di6K6BxVC

https://t.co/UEFhewds2M

https://t.co/s6hKQz9gLz

https://t.co/F9Dkcfrq8l

总结 2014 年 vanilla GAN 的每一个进步，就和观看第(🍐) 8 季《权力的游戏》一(✋)样困难。因此，我将回顾几年来 GAN 研究(💑)中最酷结果背后的关键思想。

我不打算详细解释转置卷积和 Wasserstein 距离等概念。相反，我将提供一些最好的资源的链接，你可以使用这些资(👲)源快速了解这些概念，这样你就会了解它们是如何融入大局的。

如果你还在阅读，我假设你知道深度学习的基础知识，你知道卷积神经网络是如何工(🏜)作的。带着这些前提，下面先看看 GAN 的发展路线图：

GAN 的发展路线图

我们将按照下面的顺序，一步一步学习它：

GAN：生(✒)成(💅)对抗网络

DCGAN：深度卷积生成对抗(👹)网(😄)络

CGAN：条件生成对抗网络

CycleGAN

CoGAN：(⏩)耦合生成对抗(👻)网络

ProGAN：(🈶)生成对抗网络的渐进式增长

WGAN：(🤹)Wasserstein 生成对抗网络

SAGAN：自注意力生成对抗网络

BigGAN：大生成对抗性网络

StyleGAN：基于风格的生成对抗网络

接下来(🤝)让我们开始吧！

1.GAN：生成对抗网络

图片来自于这篇论文：https://arxiv.org/pdf/1406.2661.pdf

相关资源：

论文

代码

其他重要资(📡)源：(❇)Ian Goodfellow 的 NIPS 2016 教程

现在(🧛)，我知道你在想什么了——天啊，那张令人毛骨悚然的、模糊的图像(📳)看起来像是一个数学迷从 Excel 表格中制作图片后放(⛲)大的(🧖)结果。

好吧，其实你猜的多多少少是对的（除(📗)去 excel 部分）。

早在 2014 年，Ian Goodfellow 就提出了一个革命性的想法——让两个神经网络相互竞争(🍭)（或合作(👾)，这是一个观点问题）。

一个神经网络试图生成接近真实的数据（注意，GANs 可以用来模拟任何数据分布，但目前主要用于图像），另一个网络试图区分真实的数据和由生成网络生成的数据。

生成器网络(🍸)使用判别器作为损耗函数，并(🥓)更新其参数以生(🚅)成看起来更(😉)真实的数据。

另一方面，判别器网络更新其参数，以便更好地从真实数据中识别(➡)出假数(🕦)据。所以它的性能也变得更好(🛃)了。

这个猫鼠游戏继续进行，直到系统达到所谓的「平衡」。达到平衡以后，生成器创建的数据看起来足够真实，因此判别器能做的只是是随机猜测。

希望到目(🤦)前为止，如果(🔡)你正确地缩进了代码，并且 Amazon 决定不停止(🧢)你的 SPOT 实例（顺便说一句，这不会发生在 FloydHub 上，因为它们提供了专用的 GPU 机器），那么你现在就有了一个生成器，可以精确地创建和你的训练数据集相同的新数据。

现在(🥡)，这是公认的 GANs 的一个非常简单的观点。你需要从这里学到的思想是，通过使用两个(🚊)神经网络—(🍘)—一个神经网络生成数(🍱)据，另一(🍊)个神经网络从假数(🌼)据中分类出真实数据。从理论上来说，你可以同时训(😑)练它们，收敛到一个点，在这个点上，生成器可以生成全新的、真实的数据。

2.DCGAN：深卷积生成(🥒)对抗网络

图片来源：https://arxiv.org/pdf/1511.06434.pdf

相关资源：

论文

代码

其他资源: 媒体文章

看到了吧，我(🐛)会给你节省时间。

卷积(✉)=对于图(🐓)像处理来说很有用(🦑)

GANs=适合(👍)生成一些东西

卷积+GANs=适合(🍟)生成图像

事后看来(🗯)，正如 Ian Goodfellow 在与(🗡) Lex Fridman 在一次广播节目中所指出的那样，他们将这种模型称为 DCGAN（即(🈯)「深层卷积生成对抗网络」）似乎很愚蠢，因为现(🤱)在几乎所(🔂)有与深度学习和图像相关的东西都是深度的、卷(🏫)积的。

另外，当大多数人了解到 GANs 时，他们或多或少都会知道(⏳)它们是「深度而(🔥)卷积」的。

然而，曾经有一段时间，GANs 并不一定使用基于卷积的操作(🔣)，而是依赖于标(♎)准的多层感知器架构。

DCGAN 改变了这一点，使(😀)用了一种被称为转置卷积运算的方法，它还有一个「不幸的」名称，即反卷(⚓)积(🎷)层。

转置卷积可以进行向上缩放操作。它们帮助我们将低分辨率图像转换为高分辨率图像。

但是，严肃地说，你(🆗)需要通过上面介绍的论文、低吗和媒体资源来更好地理解转置卷积，因为它们是所有现(🏡)代 GAN 架构的基础。

不过，如果你的时间有点短，那么你可以通过观看一(🙃)个简单的动画，来大概了解转置卷积是如何工作的：

在 vanilla 卷积中，你应用一系列卷积（连同其他操作）来将图像映射到更低维的向量。

同样，按顺序应用多个转置卷积可以使我们将一个低分辨率的单阵列演化为一个色彩(🗓)明(🛌)艳的全彩图像。现在，在继续之(💝)前，我们(🐄)先来探索一(💧)下使用 GAN 的(⤵)一些独特方法。

你现在处在第二个红色的「X」的位置

3.CGAN：条件生成对抗网络

图片来源于论文：https://arxiv.org/pdf/1411.1784.pdf

相关资源：

论文(📡)

代码

其(💸)他重要资源：博客

原始的 GAN 从随机噪声中生成数据。这意味着你可以训练它，以小狗图像为例，它会产生更多的小狗图像。

你还可以在小猫图(🐹)像上训练它，在这种情(🎓)况下，它(🏥)将生成小猫的图像。

你也可以在演员 Nicholas Cage 的照片图像上训练它，在这种情况下，它(🤓)将生成 Nicholas Cage 图像(🕖)。

你也可以在很多别的图像上训练它。明白了吗？在什么图像上训练 GAN，它就能生成更多的类似图像。

然而，如果你同时尝试在狗和猫的图像上训练它，它会生成模糊的半品种，就和下图一样。

图片由 Anusha Barwa 拍摄于 Unsplash

CGAN（代表「条件生成对抗网络」）旨在通(📓)过告诉生成器只生成一个特定类的图(💰)像来解决这个问题，例如猫、狗或 Nicholas Cage。

具体来说(👐)，CGAN 将一个 one-hot 向量 y 连接到随机噪声矢量 z，得到如下结构：

现在，我们就可以利用同一个 GAN 生成猫和狗。

4.CycleGAN

相(👘)关资源：

论文：

代码

其他重要资源：Cyclegan 项目

媒体文章

GANs 不仅仅用于生成图像。他(🕢)们还可以创造外表上同时具有马和斑马特点的生物，如上图所示。

为了创建这些图像，CycleGAN 致力于解决一个被称为图像到图像翻译的问题。

CycleGAN 不是一种新的 GAN 架构，虽然它推动了最先进的图像合成技术。相(🛐)反，它是一种使用 GANs 的聪明方法。所以你可以自由地在任何你喜欢的架构中使用这种技术。

这里有一篇文章，我建议你读一下。它写得(🐎)非常好，甚至对初学者来(➡)说也很容易理解。文章地址：https://arxiv.org/abs/1703.10593v6。

这里(🌦)的任务是训练网络 G（(👚)X），将图像从源域 X 映射到(🅱)目标(✴)域 Y

但是，等等，你可能会问，「(📊)这和常规的深度学习或风格转换有什么不(🕍)同」。

好吧，下面的图片很(💉)好地(🎌)总结了这一点。CycleGAN 进行未配对的图像到图像的转换。这意味(🔠)着(🛬)我们正(🗨)在训练的图像(💣)不必代表相同(🦀)的东西(🔠)。

如果我们有大量的图像（DaVinci-ify 的图像绘画）对收藏的话，DaVinci-ify 将（相对地）很容易识(🎏)别图(Ⓜ)像。

不幸的是，这家伙没来得及完成太多的画。

然而，CycleGAN 使用未配对的数据进行训练。所以我们不需要相同事物(🏕)的两个图像。

另一方面，我们可以使用样式(🚑)转换。但这只会提取一个特定(🌋)图像的样式，并将其转换为另一个图像，这意味着我们无法从马转换为斑马。

然而，CycleGAN 学习从一个图像域到另一个图像域的映射。所以我们(📰)可以在所有 Monet 绘画的集合(💎)上对它进行训练。

他们使用的方法相当优雅。CycleGAN 由两个生成器 G 和 F 以及两个判别器 Dx 和 Dy 组成。

G 从(🐗) X 中获取图像，并(😉)试图将其映射到 Y 中的某个图像。判别器 Dy 判断图像是由 G 生成的，还是实际上是在 Y 中生成的。

同样地，F 从 Y 中获取一个图像，并(🌨)试图将其映射到 X 中的某个图像，判别器 Dx 预(🌐)测图像是由(⬇) F 生成的还是实际存在于 X 中的。

所有四个网络都是以普通的 GAN 的方式训练的，直到得到强大的生成器 G 和 F，它们可以很好地执行图像到图像的翻译任务，骗过(😃)判别器。

这种对抗性的损失听起来是个好主意，但还不够。为了(🤼)进一步提高性(⬅)能，CycleGAN 使用另一个度(🤷)量(🕣)，即(🔓)循环一致性损失。

一般来说，想想好的翻译(💾)人员的特点。其(🌕)中之一是，当(🔂)你来回翻译时，你应该得到同样(🏅)的东(🐎)西。

CycleGAN 巧妙地实现了这个想法，它强制网络遵守这些限制条件：

F（G（x））≈x，x∈(🕺)X

G（F（y））≈y，y∈Y

从视觉上看，循环一致性(🎵)如下：

总损耗函数的构造方式是，惩罚不符合上述特性的网络。我不打算在这里写出损失函数，因为这会破坏它在(🕶)论文里面的组合方式。

好吧，在越聊越偏之前，让我们回到(🐃)寻找(🍊)更好的 GAN 架构(😀)的主要任务。

5.CoGAN：(🚝)耦合生成对抗网络

图片来源于论文：https://arxiv.org/pdf/1606.07536.pdf

相关资源：

论文：

代码：

其他重要资源：博客论文

你知道什么比一个 GAN 更好吗？两(🎐)个 GAN！

CoGAN 就是这样(🕳)做(🆑)的（CoGAN 代表「耦合生成对抗(🕉)网络」，不要(📇)与 CGAN 混淆，CGAN 代表条件生成对抗网络）。它训练的是「两(🕐)个」GAN 而不是一个。

当然，GAN 的研究人员也无法停止将 GAN 类比成警察和伪造者的言论。因此，GAN 背后的思(🧥)想，用作者自己的话说就是：

在比赛中，有两个队，每个队有两名队员。生成模型(🛑)组成一个团(🏅)队，共同在两个(🐧)不同(🚉)的域中合成一对图像，以混淆区分模型。判别模型试图将从各(🚭)自领域的训练数据分布中提取的(👦)图像与从各自生成模型中提取的图像区分开来(🔅)。同一队(🤯)的队员之间的协作是从权重分担机制中建立起来的(🖇)。

好吧，有一个由多个 GAN 组成的局域网络听(🔅)起来不错，但你如何使它工作？

结果证(💔)明这并不太复杂(🙂)，你只需要让(😒)网络对某些层使用完全相同的权重。