Adversarially Regularized Autoencoders 阅读

发表在 ICML 2018

动机

深度隐变量模型 VAE 和 GAN 在连续结构上表现很好，但应用到离散结构（如文本序列或离散图像）上却表现较差，在此篇论文中，作者针对此提出了一个灵活的方法来训练深度隐变量模型。

方法

基于之前提出的 WAE（Wasserstein Autoencoder，将对抗性自动编码器（AAE）形式化为最佳运输问题）。作者首先将该框架扩展为离散序列建模，然后进一步探索针对可控表示的不同学习先验知识。我们的模型从输入空间到对抗正则化的连续隐空间中学习编码器。但是，与使用固定先验的 AAE 不同，作者像 GAN 一样改为参数化先验学习。像序列 VAE 一样，该模型不需要使用策略梯度或连续松弛。与 GAN 一样，该模型通过参数化生成器学习先验提供了灵活性。

形式化

模型（ARAE）

主要是将离散的自编码器和 GAN 的正则化的潜在表示结合起来

Discrete Autoencoder

两个过程：编码 X --> Z

解码 Z --> X'

损失函数：交叉熵损失
Generative Adversarial Networks

生成器 G：z~ = g(s)

判别器 D

Pz 和 P* 分别为生成、真实的分布

使用 Wasserstein-1 distance（WGAN中使用到的）来最小化 W（Pz, P*）

损失函数：
ARAE

模型框架：

其实就是上面的两种模型进行了一个结合

算法：