Tensorflow2.0—DeepLab v3+分割网络原理及代码解析(一)
在好久好久之前,研究过一段时间的语义分割模型,但是一直没有用过。最近,因为工作需要,又要重新拾起图像分割了~依旧找到了大佬的代码和讲解blog,再加上自己的一些理解,希望在大佬的基础之上增加一些自己的见解。
大佬的blog:https://blog.csdn.net/weixin_44791964/article/details/122655063
大佬的代码git地址:https://github.com/bubbliiiing/deeplabv3-plus-tf2
话不多说,直接开始~
一、项目总览
从git上面clone好项目到本地之后,打开项目:
- datasets:保存原始图片数据
- img:这个文件夹基本上没啥用,就是放测试图片的地址
- logs:存放模型的权重文件地方
- model_data:存放原始的backbone权重文件
- nets:主干网络模型和backbone模型
- utils:一些处理脚本
- VOCdevkit:存放经过处理之后的训练验证图片的地址
- deeplab.py:测试主文件
- get_miou:进行指标评估
- json_to_dataset.py:将标注文件转换为模型支持的格式
- predict.py:测试脚本
- summary.py:查看网络结构
- train.py:用于开启训练脚本
- voc_annotation.py:划分数据集
二、模型基本原理
有时间再补…