原理和代码解读:音频驱动数字人经典项目AniPortrait

Diffusion models代码解读:入门与实战

前言:现在基于Diffusion的音频驱动数字人的工作有很多,其效果也是各有千秋。这篇博客解读一篇经典的工作AniPortrait,搞懂这篇经典之作,对于理解其他数字人的工作有很多好处。

目录

原理解读

代码解读

Audio2Mesh

Audio2Pose

DataLoader


原理解读

总的模块分成两个部分,这篇博客先重点解读第一部分 Audio2Lmk。

让我们设 \( A_{1:T} = a_1, \ldots, a_T \) 表示

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/145923542
今日推荐