16.ViT模型介绍 - 代码天地

16.ViT模型介绍

企业开发 2023-12-16 21:46:50 阅读次数: 0

Vision Transformer

关于ViT

Transformer自2017年06月由谷歌团队在论文Attention Is All You Need中提出后，给自然语言处理领域带去了深远的影响，其并行化处理不定长序列的能力及自注意力机制表现亮眼。根据以往的惯例，一个新的机器学习方法往往先在NLP领域带来突破，然后逐渐被应用到计算机视觉领域。时间来到2020年10月，同样是谷歌团队提出了将Transformer应用到视觉任务的方法，Vision Transformer(ViT)。

论文：AN IMAGE IS WORTH 16X16 WORDS:
TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

关于对Transformer的介绍可以参考Transformer 介绍
。

将Transformer应用于视觉任务的一种想法是将图像每个像素都flatten,得到一个表示图像的序列，作为模型的输入。但对使用自注意力模块的transformer来说，这种方法随着图像分辨率的变大，计算复杂度也变得很高，因为scaled dot self attention计算时 $\frac{QK}{\sqrt{d_k}}V$ 的复杂度是序列长度的平方。譬如对于640*640的图像，序列长度 $L$ 将达到409600,这远远超出当前transformer所能处理的序列长度。

在ViT中，作者是将输入图像等分成大小为16X16的patch，然后通过image embedding将输入从NCHW转换成(N, hidden_dim, (n_h * n_w)), n_h和n_w是H//patch_size和W//patch_size的大小，flatten后得到长度为 $L=n_h*n_w$

猜你喜欢

转载自blog.csdn.net/lx_ros/article/details/134149767

16.ViT模型介绍

vit网络模型简介

ViT模型——pytorch实现

VIT模型个人笔记

Visual Transformer (ViT)模型详解

ViT

vit-transformer模型结构及源码解读

Visual Transformer (ViT)模型与代码实现（PyTorch）

VIT模型简洁理解版代码

ViT模型架构和CNN区别

深入了解ViT模型的代码

Transformer Vision（二）|| ViT-B/16 网络结构

ViT/vit/VIT详解

vit的cam和注意力图： VIT模型的可解释性

课程四学习笔记: ViT模型全流程拆解

ViT杀疯了，10+视觉Transformer模型详解

Transformer在计算机视觉中的应用-VIT、TNT模型

ViT模型关联的Layer Normalization研读（一）初学者

ViT模型中的tokens和patches概念辨析

AN IMAGE IS WORTH 16X16 WORDS :TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE（VIT）

论文解读：ViT | AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

李沐精读论文：ViT 《An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale》

【笔记记录】ViT：AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

达摩院modelscope模型开源平台推出快速体验ViT模型

VGG16模型

PDO介绍（16）

Python介绍（16）

模型介绍

神经网络学习小记录67——Pytorch版 Vision Transformer（VIT）模型的复现详解

神经网络学习小记录66——Vision Transformer（VIT）模型的复现详解

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)