【Swin Transformer】Win10使用Swin Transformer做语义分割 (使用自己的数据集 + 图解超详细)

Win10使用Swin Transformer做语义分割 (使用自己的数据集 + 图解超详细)

Swin-Transformer-Semantic-Segmentation

Swin Transformer 做语义分割的代码地址如下:https://github.com/SwinTransformer/Swin-Transformer-Semantic-Segmentation

但是,搭建完环境后会出现 报错TypeError: EncoderDecoder: SwinTransformer: __init__() got an unexpected keyword argument 'embed_dim' ,链接如下:https://github.com/open-mmlab/mmsegmentation/issues/752

注意:问题出在配置文件和模型的embed维度变量命名为embed_dim,但在模型内部的命名为embed_dims

mmsegmentation

根据上面issues的解答,我选用了OpenMMLab的修改版源码,链接如下:https://github.com/open-mmlab/mmsegmentation

于是,便重新进行部署。

mmsegmentation 已支持的数据集类型

其中,大部分数据集支持免费下载。

mmcv安装

参考文章:https://blog.csdn.net/qq_44824148/article/details/124099034?spm=1001.2014.3001.5502

mmdet安装

参考文章:https://blog.csdn.net/qq_44824148/article/details/124099034?spm=1001.2014.3001.5502

apex安装

参考文章:https://blog.csdn.net/qq_44824148/article/details/124099034?spm=1001.2014.3001.5502

下载权重

所有模型及其对应权重均在readme.md中。

测试

deeplabv3plus 模型为例,测试ade20k数据集,测试命令如下:

python tools/test.py configs/deeplabv3plus/deeplabv3plus_r50-d8_512x512_80k_ade20k.py checkpoints/deeplabv3plus_r50-d8_512x512_80k_ade20k_20200614_185028-bf1400d8.pth --show
在这里插入图片描述

pspnet 模型为例,测试cityscapes数据集,测试命令如下:

python tools/test.py configs/pspnet/pspnet_r50-d8_512x1024_40k_cityscapes.py checkpoints/pspnet_r50-d8_512x1024_40k_cityscapes_20200605_003338-2966598c.pth --show

训练

使用的为单GPU训练的,使用ade20k数据集,训练pspnet模型的权重,命令如下:

python tools/train.py ./configs /pspnet/pspnet_r50-d8_512x512_80k_ade20k.py

猜你喜欢

转载自blog.csdn.net/qq_44824148/article/details/124658561
今日推荐