关于vgg,训练 text mask, 中遇到的疑问

用vgg做text的mask,像pixellink,east 那样融合conv3_3', 'conv4_3', 'fc7几层特征,得到融合 特征时候,每输出一个特征点,使用输入特征的一行,发现有效果,确实对横长文本,检测了,文本中间有很大的空白也可以检测成一个。但是对于改成纵向就不好了,难道我关于纵向的想法有错吗?

纵向我是用features = tf.image.rot90(inputs, 1),得到,然后像横向文字那样处理,处理完成了,再转回来

features = tf.image.rot90(inputs, 1)
        features = self._local_connected_layer(features, out_c, scope)
        features = tf.image.rot90(features, 3)

结果就是没有直接使用features = self._local_connected_layer(features, out_c, scope),检测的横向文字好

猜你喜欢

转载自blog.csdn.net/northeastsqure/article/details/87966956