【Image captioning】RSTNet: Relationship-Sensitive Transformer Network在自定义数据集的调试与实现

RSTNet: Relationship-Sensitive Transformer Network在自定义数据集的调试与实现

作者:安静到无声 个人主页

网格特征和字幕文件的预处理

在上一节我们提取了自定义数据集的网格特征构成如下,我们将其进行预处理,才能符合原始代码的格式:image-20230908100529756

首先,为了解决形状差异并将特征形状与区域特征形状&#x

猜你喜欢

转载自blog.csdn.net/lihuanyu520/article/details/132780561