基于 RTVC-7 Voice Cloning Model 的 Cross-Lingual TTS 的三步走: 第二步 Tuned-EarSpeech 时 ASV-T-SNE

其他 2021-03-20 19:32:30 阅读次数: 0

0. 说明

GE2E 的提取在: https://blog.csdn.net/u013625492/article/details/114433738, 第三章

张阳的目前是他直接帮忙提取的

现在分别画出这些的 T-SNE 图

代码很短, 放在: ASV-T-SNE 项目中

1. 张阳的 Speaker Embedding

选了 20 个说话人, random 了几次, 效果最好的拿了出来, 是这幅图~
如果选 30 个人的话, 说话人之间还是可能分不开

画图的代码在: https://github.com/ruclion/ASV-T-SNE

感谢张阳的帮助~

2. GE2E 的 Speaker Embedding

估计差不多, 先不画了

看看实验室有没有在观察 Embedding 上有经验的 TODO

猜你喜欢

转载自blog.csdn.net/u013625492/article/details/114636401

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)