手把手写深度学习(17):用LSTM为图片生成文字描述(Image-to-text任务)

前言:近年来text-to-image的任务非常火爆,大模型如Della、Imagen、GLIDE等都取得了良好的效果;其镜像任务image-to-text的相关研究却比较少,这篇博客手把手带大家用简单的LSTM网络搭建一个image-to-text系统。

目录

LSTM科普

环境配置

实现方法

数据集下载

代码

猜你喜欢

转载自blog.csdn.net/qq_41895747/article/details/126275867