AIGC(MLLM、VLM、LLM、SD)系列——论文解读目录

涉及面广:多模态生成模型——MLLM ( 目前集中在视觉语言模型——VLM)、大语言模型——LLM、生成模型(SD系列)、对比学习的经典模型(CLIP系列)。

持续更新:对于已经完成解读的会附上链接(有的会在一些场景做尝试,也会附上链接供大家快速参考结果),准备写的会备注筹备中。

适宜人群:节省大把时间,快速定位需要的部分,适合学生、入门AIGC者和从业者作为笔记检索使用。

RAM

论文题目:Recognize Anything: A Strong Image Tagging Model

关键词:RAM、属性识别、多标签分类、解读

论文解读:http://t.csdnimg.cn/bhy5e

应用测试:

猜你喜欢

转载自blog.csdn.net/u012863603/article/details/135464899