视频编码器架构【视频理解,视频生成】

在这里插入图片描述

InternVideo2-Chat-8B-stage3的视频编码器
具体细节查看/mnt/data/group/zzk/projects/models/InternVideo2-Chat-8B/modeling_internvideo2_vit.py的856行
下面代码是第三阶段的,图中Projection只用于第一阶段训练。详见InternVideo2_Paper
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_45934285/article/details/141558821