前言
最近在整理研究生期间看过的一些论文和源码,主要是检测这一块。后续会把我看过的代码按照Anchor Based Detection、Anchor Free Detection和Transformer Based Cls&Det三大类进行讲解。
这里主要是Transformer Based Cls&Det,介绍一些这两年大火的Transformer理论、分类模型以及检测模型等。目前已讲解完的Transformer Based 的Cls&Det:Transformer、ViT、DETR、Deformable DETR。
后续讲解计划:
- DAB DETR
- DN DETR
- H-Deformable DETR
- DINO
- Swin Transformer v1
- MobileViT
一、Transformer理论
- 【Transformer专题】一、Attention is All You Need(Transformer入门).
- 【Transformer 相关理论深入理解】注意力机制、自注意力机制、多头注意力机制、位置编码.
二、分类模型
- 【Transformer专题】Vision Transformer(ViT)原理 + 代码.
- 【Swin Transformer原理和源码解析】Hierarchical Vision Transformer using Shifted Windows.
三、检测模型
3.1、DETR
- 【DETR 论文解读】End-to-End Object Detection with Transformer.
- 【DETR源码解析】一、整体模型解析.
- 【DETR源码解析】二、Backbone模块.
- 【DETR源码解析】三、Transformer模块.
- 【DETR源码解析】四、损失计算和后处理模块.