前言:扩散模型在图像领域的成功人尽皆知,其实扩散模型在音频领域相当成功,可以根据输入的一小段音频,就能微调生成出自己曲风的音频。这篇博客从代码开始讲解,使用预训练的音频扩散模型微调生成自己曲风的音频。
目录
加载预训练模型
import torch, random
import numpy as np
import torch.nn.functional as F
from tqdm.auto import tqdm
from IPython.display import Audio
from matplotlib import pyplot as plt
from diffusers import DiffusionPipeline
from torchaudio import