transformer零基础学习 - 代码天地

transformer零基础学习

企业开发 2023-10-01 00:57:21 阅读次数: 0

声明：以下文章链接仅用于个人学习与备忘。

基础知识

1：零基础解析教程 [推荐]
https://zhuanlan.zhihu.com/p/609271490

2：Transformer 详解 [推荐]
https://wmathor.com/index.php/archives/1438/

3：如何从浅入深理解transformer？
https://www.zhihu.com/question/471328838/answer/3011638037

4：Transformer模型详解（图解最完整版）[推荐]

Transformer模型详解（图解最完整版） - 知乎

5：万字长文解读Transformer模型和Attention机制 [推荐]

【经典精读】万字长文解读Transformer模型和Attention机制 - 知乎

疑惑解析

1：transformer decoder里的K和V为什么要用encoder输出的K和V?

https://www.zhihu.com/question/458687952

2： Teacher Forcing 、 Autoregressive、Exposure Bias 解释

关于Teacher Forcing 和Exposure Bias的碎碎念 - 知乎

3： decoder部分训练是怎么并行化的？

浅析Transformer训练时并行问题 - 知乎

浅析Transformer训练时并行问题_transformer并行化体现在哪里_思考实践的博客-CSDN博客

Transformer decoder中masked attention的理解_寺里LZS的博客-CSDN博客

4：在测试或者预测时，Transformer里decoder为什么还需要seq mask？

在测试或者预测时，Transformer里decoder为什么还需要seq mask？ - 知乎

深入理解transformer源码_赵队的博客-CSDN博客

猜你喜欢

转载自blog.csdn.net/lilai619/article/details/131410327

transformer零基础学习

CV领域Transformer之Self-Attention零基础学习

零基础学习Docker

零基础学习SpringBoot

零基础学习hadoop

java学习零基础

Markdown零基础学习

Java零基础学习

零基础理解为什么是Transformer？什么是Transformer？（深入浅出通俗理解Transformer及其pytorch源码）

零基础学习，MySQL基础操作

web零基础学习笔记

零基础入门深度学习

真正零基础学习HTML(二)

零基础开始学习Linux系统

零基础入门学习Python

零基础学习Python--000

真正零基础学习HTML（五）

真正零基础学习HTML（四）

零基础如何学习大数据？

真正零基础学习HTML（三）

零基础学习01（hello world）

零基础学习python——列表

零基础学习——ADB工具使用

区块链零基础学习线路

如何零基础入门机器学习？

零基础学习大数据

零基础如何学习C语言？

零基础web安全学习计划

零基础如何迅速学习java

编程零基础，如何学习Python?

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)