代码实战:使用扩散模型微调生成自己曲风的音频

Diffusion Models专栏文章汇总:入门与实战

前言:扩散模型在图像领域的成功人尽皆知,其实扩散模型在音频领域相当成功,可以根据输入的一小段音频,就能微调生成出自己曲风的音频。这篇博客从代码开始讲解,使用预训练的音频扩散模型微调生成自己曲风的音频。

目录

加载预训练模型

音频到频谱的转换

加载数据集

训练

推理 


加载预训练模型

import torch, random
import numpy as np
import torch.nn.functional as F
from tqdm.auto import tqdm
from IPython.display import Audio
from matplotlib import pyplot as plt
from diffusers import DiffusionPipeline
from torchaudio import

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/142316769