利用时序建模和增强多模态融合生成稠密视频描述

文章转自:http://burningcloud.cn/article/160/index.html