非常详细的transformer笔记，包括XLNet, MT-DNN, ERNIE, ERNIE2, - 代码天地

非常详细的transformer笔记，包括XLNet, MT-DNN, ERNIE, ERNIE2,

编程语言 2020-12-30 20:49:47 阅读次数: 0

华校专老师更新了个人笔记，增加了 Transformer笔记，包含XLNet, MT-DNN, ERNIE, ERNIE2, RoBERTa 等内容，内容十分详细，非常值得学习，特此推荐。

作者华校专，曾任阿里巴巴资深算法工程师、智易科技首席算法研究员，现任腾讯高级研究员，《Python 大战机器学习》的作者。华老师也是我们的知识星球的嘉宾。

这是作者多年以来学习总结的笔记，经整理之后开源于世。

笔记地址：

http://www.huaxiaozhuan.com/深度学习/chapters/7_Transformer.html

Transformer简介

Transformer 是一种新的、基于 attention 机制来实现的特征提取器，可用于代替 CNN 和 RNN 来提取序列的特征。

Transformer 首次由论文《Attention Is All You Need》提出，在该论文中 Transformer 用于 encoder - decoder 架构。事实上 Transformer 可以单独应用于 encoder 或者单独应用于 decoder 。

Transformer笔记目录

一、Transformer

1.1 结构
1.2 Transformer vs CNN vs RNN
1.3 实验结果

二、Universal Transformer

2.1 结构
2.2 ACT
- 2.3 实验结果

三、Transformer XL

3.1 Segment-level 递归
3.2 相对位置编码
- 3.3 实验结果

四、GPT

4.1 GPT V1
4.2 GPT V2

五、BERT

5.1 预训练
- 5.2 模型结构
- 5.3 微调
- 5.4 性能

六、ERNIE

6.1 ERNIE 1.0
6.2 ERNIE 2.0

七、XLNet

7.1 自回归语言模型 vs 自编码语言模型

7.2 Permutation Language Model
- 7.3 Two-Stream Self-Attention
7.4 Partial Prediction
7.5 引入 Transformer XL
7.6 多输入
7.7 模型比较
- 7.8 实验

八、MT-DNN

8.1 模型
- 8.2 实验

九、BERT 扩展

9.1 BERT-wwm-ext
- 9.2 RoBERTa

笔记截图

非常详细的transformer笔记，包括XLNet, MT-DNN, ERNIE, ERNIE2,

笔记截图

非常详细的transformer笔记，包括XLNet, MT-DNN, ERNIE, ERNIE2,

其他

华校专老师的个人网站：

http://www.huaxiaozhuan.com/
笔记地址：

http://www.huaxiaozhuan.com/深度学习/chapters/7_Transformer.html

github：

https://github.com/huaxz1986

猜你喜欢

转载自blog.51cto.com/15064630/2578562

非常详细的transformer笔记，包括XLNet, MT-DNN, ERNIE, ERNIE2,

RoBERTa、ERNIE2、BERT-wwm-ext和SpanBERT

ERNIE学习笔记

NLP：Transformer在NLP自然语言领域的简介(预训练技术)、NLP模型发展(ELmo/GPT/BERT/MT-DNN/XLNet/RoBERTa/ALBERT)、经典案例之详细攻略

ERNIE-DOC: A Retrospective Long-Document Modeling Transformer

BERT和ERNIE记录

BERT升级——ERNIE

预训练模型ERNIE

ernie-vil/g(1/2)

ERNIE: Enhanced Language Representation with Informative Entities论文笔记

这可能是第一篇比较全的ERNIE踩坑笔记——Centos下玩转ERNIE

NLP：自然语言领域NLP模型发展(ELmo→GPT/BERT→MT-DNN→XLNet→RoBERTa→ALBERT)l历程简介、重要算法介绍之详细攻略

【文档智能】ERNIE-Layout

预训练模型（5）---- SpanBERT&RoBERTa&ERNIE2

论文笔记：NLP之BERT，ERNIE(pre-training 模式在NLP任务中的使用)

NLP：自然语言领域NLP模型发展(ELmo→GPT/BERT→MT-DNN→XLNet→RoBERTa→ALBERT)l历程简介、重要算法介绍之详细攻略daiding—已全部迁移新书中

百度paddle ernie 实战

国产的自然语言处理框架ERNIE

基于ERNIE3.0的中文评论分类

百度ERNIE 2.0强势发布！16项中英文任务表现超越BERT和XLNet

中文预训练模型ERNIE2.0模型下载及安装

PaddleHub提供的ERNIE进行文本分类

中文预训练模型 ERNIE2.0 模型下载及安装

详解ERNIE-Baidu进化史及应用场景

(2019ACL)ERNIE：Enhanced Language Representation with Informative Entities

“地理-语言”大模型文心ERNIE-GeoL及应用

【深度学习】BERT变种—百度ERNIE 1.0

电影评论情感分析：基于Ernie-3.0的实践

【深度学习】BERT变种—百度ERNIE 3.0

【深度学习】BERT变种—百度ERNIE 2.0

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)