神经风格转移

神经风格转移(NST)指的是一类软件算法,它操纵数字图像或视频,以采用另一图像的外观或视觉风格。NST算法的特点是使用深度神经网络来进行图像转换。NST的常见用途是从照片中创造人工艺术品,例如将名画的外观转移到用户提供的照片上。

早期的风格转移算法

NST是图像风格化的一个例子,这个问题在非逼真渲染领域研究了20多年。最早的两种基于实例的风格转移算法是图像类比和图像拼接。这两种方法都是基于基于补丁的纹理合成算法。给出一对训练图像–照片和描绘该照片的艺术品–可以学习转换,然后通过类比,应用于从新的照片中创造新的艺术品。如果没有训练照片,就需要通过处理输入的艺术品来产生;图像绗缝不需要这个处理步骤,尽管它只在一种风格上演示。

神经风格转移的表述

NST的过程假设一个输入图像被送入CNN,网络激活在VGG-19架构的后期卷积层被采样。通过CNN输入,网络激活在VGG-19架构的后期卷积层中被采样。让{displaystyleC(p)}是产生的输出样本,称为”内容”。是产生的输出样本,称为输入的”内容然后被送入同一个CNN,在CNN的早期和中期层对网络激活进行采样。

神经风格转移

这些激活被编码为一个格拉姆矩阵表示,称之为{displaystylex}是通过在输入图像中加入少量的白噪声来实现的。最初是通过向输入图像添加少量白噪声来逼近的{displaystylep}中加入少量白噪声,并通过CNN并通过CNN进行反馈。然后,我们在CNN权重固定的情况下,通过网络连续反向传播这一损失,以更新x的像素。算法通常在GPU上实现,因此训练只需几分钟时间。

神经风格转移的扩展

NST也被扩展到视频。随后的工作提高了NST对图像的速度。

相关文章

扫码分享到朋友圈