图像转文字技术实现原理

图像转文字的技术叫做image Caption。image caption的网络结构其实是基于encoder_decoder结构的。

Image caption将Decoder中的rnn网络换成了cnn网络,将decoder中的rnn网络换成了lstm网络。

网络结构如下图所示:

两个改进的方向:

1. 引入注意力机制

2. 引入高层语义模型

发布了23 篇原创文章 · 获赞 1 · 访问量 1369

猜你喜欢

转载自blog.csdn.net/langsiming/article/details/102943538