논문 해석 X-CLIP : 일반 비디오 인식을 위한 언어 이미지 사전 훈련 모델 확장

NoSuchKey

추천

출처blog.csdn.net/flyingluohaipeng/article/details/126648783