2019ins---Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star-GAN - 代码天地

2019ins---Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star-GAN

其他 2020-01-11 18:55:19 阅读次数: 0

会议：2019interspeech
单位：阿里巴巴 ai lab

abstract

对于non-parallel many-to-many vc的任务，本文提出一个基于residual Star-GAN的快速学习结构。基于最新的StarGAN-VC，它学习多说话人的声学特征之间的unreference mapping。
本文加一个residual mapping改进，称之为Res-StarGAN-VC. 短的连接没有增加参数量和计算复杂度，也可以在训练初始时生成高质量的fake sample。结果表明：（1）对应训练中更快的收敛；（2）在单语种和跨语种的任务中, 转换语音更清楚的发音和更好的相似度。

introduction

可以根据source 和target speaker是否是同一语种，将vc分成mono-lingual 和cross-lingual。

研究背景

VCC 2018 N10在非平行数据-many2many的任务上达到很好的效果，但存在的问题有：（1）依赖大量的识别和合成数据，（2）是一个many2one的任务，不同的说话人要训练不同的模型。
CVAEs（conditional variational autoencoders）可以在小数据上起效果，但是输出会有over-smooth。
GAN很好的克服了CVAE的缺点。StarGAN是GAN的变种，只需要一个网络结构完成many2many的mapping。生成器的输入是特征和域信息，学习把特征转到对应的域。输入特征的标签被用于表示域信息。StarGAN-VC可以完成many2many-非平行数据的转换。
缺点：（1）学习速度很慢；（2）转换的语音质量不够好。
原因：（1）网络直接学习一组说话人声学特征之间unreference mapping。既要转换说话人的身份特征，又要保留文本信息。
改进–Res-StarGAN-VC：受resnet的启发，在生成器的输入和输出之间直接加identity shortcut connection。使得网络可以学习referenced residual mapping，不仅可以加速训练过程，也能提高语音质量。

Residual StarGAN Voice Conversion

文章是真的有点难读，放弃了。。。。

林林宋

发布了98 篇原创文章 · 获赞 9 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/103009205

2019ins---Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star-GAN

StarGAN-VC： non-parallel many-to-many voice conversion with StaGAN

F0-CONSISTENT MANY-TO-MANY NON-PARALLEL VOICE CONVERSION VIA CONDITIONAL AUTOENCODER

sub2019ins:A Vocoder-free WaveNet Voice Conversion with Non-Parallel Data

Non-parallel Voice Conversion using Weighted Generative Adversarial Networks

Transferring Source Style in Non-Parallel Voice Conversion

Many-to-many Cross-lingual Voice Conversion with a Jointly Trained Speaker Embedding Network

Many-to-Many Voice Conversion based Feature Disentanglement using Variational Autoencoder

Odessey2018:Average Modeling Approach to Voice Conversion with Non-Parallel Data

语音合成论文优选：声音转换Non-Parallel Sequence-to-Sequence Voice Conversion with Disentangled Linguistic

[论文笔记] Phonetic posteriorgrams for many-to-one voice conversion without parallel data training

2016 ICME:Phonetic posteriorgrams for many-to-one voice conversion without parallel data training

2018icassp-Non-parallel voice conversion using variational autoencoders conditioned by phonetic PPGs

Cycle-consistent Adversarial Networks for Non-parallel Vocal Effort Based Speaking Style Conversion

The Voice Conversion Challenge 2018

2019trans--Sequence-to-Sequence Acoustic Modeling for Voice Conversion

Residual Learning

many-to-many

Voice conversion with SI-DNN and KL divergence based mapping without parallel training data

Parallel-data-free voice conversion using cycle-consistent adversarial networks

2018ins--Wavelet Analysis of Speaker Dependent and Independent Prosody for Voice Conversion

FASTSVC: FAST CROSS-DOMAIN SINGING VOICE CONVERSION WITH FEATURE-WISE LINEAR MODULATION论文理解

2019icas--Cross-lingual Voice Conversion with Bilingual Phonetic PosteriorGram and Average Modeling

hibernate的many-to-many的示例

Whether To Pretrain DNN or Not?: An Empirical Analysis for Voice Conversion

Unsupervised Cross-Domain Singing Voice Conversion

李宏毅，语音转换，voice conversion

Self-Supervised Representations for Singing Voice Conversion

2019/11/21 Residual Learning论文学习

Hibernate多对多（Many-to-Many）映射

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)