An Improved StarGAN for EVC: Enhancing Voice Quality and Data Augmentation

其他 2021-12-14 18:16:16 阅读次数: 0

作者：Xiangheng He1, Junjie Chen
单位：帝国理工 & 东京大学
会议：2021 interspeech

文章目录

abstract

情感VC之前做的不好的原因是特征解耦没有做好，把文本的信息过多删除了，导致生成语音质量低&有内容损失。
本文基于StarGAN做出改进，并提出两阶段的训练。

introduction

AutoVC & VAE的经验是：通过给decoder说话人向量，可以帮助encoder编码说话人无关的信息。并且通过联合GAN 和speaker classifier，对VC模型的结果进行增强。

method

TrainingStage1: autoencoder training

在这里插入图片描述

预训练的emotion encoder提供连续的emotion embedding;
帮助emotion-independent encoder解耦出情感无关的信息；
trconstruct loss + gan loss用于重建优化

Training Stage2:StarGAN training

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/120318500

An Improved StarGAN for EVC: Enhancing Voice Quality and Data Augmentation

Enhancing Quality for HEVC Compressed Videos

data augmentation

数据增强(Data Augmentation)

5, Data Augmentation

Series: Data Augmentation

Data augmentation 数据增强

Random Erasing Data Augmentation

Data(image) Augmentation

数据扩增(data augmentation)

Data augmentation数据增广

NLP中的Data Augmentation

数据增强（data augmentation）

QUALITY-GATED CONVOLUTIONAL LSTM FOR ENHANCING COMPRESSED VIDEO

StarGAN

Keras Data augmentation(数据扩充)

数据增强的方法 Data Augmentation

图像数据增强 Data Augmentation

物体检测的data augmentation

PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION Tero Karras

《Progressive Growing of GANs for Improved Quality, Stability, and Variation》论文笔记

PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION（PGGAN）

PGGAN(2018)：Progressive Growing of GANs for Improved Quality, Stability, and Variation

Progressive Growing of GANs for Improved Quality, Stability, and Variation(PGAN) 论文阅读

（ICASSP 19）AUTOMATIC GRAMMAR AUGMENTATION FOR ROBUST VOICE COMMAND RECOGNITION

StarGAN-VC： non-parallel many-to-many voice conversion with StaGAN

李宏毅DLHLP.10.Voice Conversion.2/2. CycleGAN and starGAN

深度学习中的数据增强（data augmentation）

Data Augmentation的几种常用方法总结

常见的数据扩充（data augmentation）方法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)