论文和代码解读:RF-Inversion 图像/视频编辑技术

Diffusion Models专栏文章汇总:入门与实战

前言:Rectified Flow的反演和DDIM这些不太一样,上一篇博客中介绍了腾讯提出的一种方法《基于Rectified Flow FLUX的图像编辑方法 RF-Solver》,主要就是用泰勒展开和一阶导数近似来分解反演公式。这篇博客介绍谷歌提出的方法RF-Inversion,这篇工作更有名,贡献度更高。

目录

为什么基于MM-DiT的反演比基于UNet的方法更难?

图像反演的挑战

公式推导

原理总结

代码解读

获取y0

获取ti

获取vt

获取vt_condition

获取新latents

后记