利用Transformers自定义一个神经网络结构 - 代码天地

利用Transformers自定义一个神经网络结构

编程语言 2022-08-13 22:42:56 阅读次数: 0

### 伪代码
import torch
from torch.optim import lr_scheduler, optimizer
from transformers import BertTokenizer, BertModel, BertPreTrainedModel
from torch import nn


# bert = BertModel('bert-base-uncased')


class BertModelCoustom(BertPreTrainedModel):
    """
    利用transformers定制化神经网络模型
    """

    def __init__(self, config):
        super(BertModelCoustom, self).__init__(config)
        # 导入配置，下面的语句对应后面实例化时候的from_pretrained
        self.bert = BertModel(config)
        
        self.linear = nn.Linear(768, 128)
        self.hidden_dropout = nn.Dropout(config.hidden_dropout_prob)

    def forward(self, x):
        # 定义前向传播
        return self.hidden_dropout(self.linear(self.bert(x)))


tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
bmc = BertModelCoustom.from_pretrained('bert-base-uncased')
for n, p in bmc.linear.named_parameters():
    print("线形层模型参数：")
    print(n)
    print(p)
    break

for n, p in bmc.bert.named_parameters():
    print("Bert模型参数：")
    print(n)
    print(p)
    break

print("hidden_dropout:", bmc.hidden_dropout)

# 调用模型
x = torch.tensor([[1, 2, 3]])
output = bmc(x)
loss = output['loss']
loss.backward()
optimizer.step()
lr_scheduler.step()

猜你喜欢

转载自blog.csdn.net/qq_38901850/article/details/125184359

利用Transformers自定义一个神经网络结构

利用tensorflow 搭建一个神经网络

Pytorch 学习（2）：神经网络及训练一个分类器（cifar10_tutorial的网络结构图）

TensoRT API自定义trt网络结构

定义一个神经网络层

各种神经网络结构

RNN循环神经网络结构

Caffe神经网络结构汇总

Lenet 神经网络结构

神经网络结构汇总

高级神经网络结构

常用的神经网络结构

卷积神经网络结构概览

深度进化网络结构表示：利用进化计算自动设计人工神经网络

DL之DNN：利用numpy自定义三层结构+softmax函数建立3层完整神经网络全部代码实现——daiding

DL之DNN：利用numpy自定义三层结构+softmax函数建立3层完整神经网络全部代码实现(探究BP神经网络的底层思想)

### 自定义损失函数的反向传播神经网络

tensorflow自定义神经网络模型

tensorflow之自定义神经网络层

神经网络优化-------自定义损失函数

基于Pytorch的神经网络部分自定义设计

Python基于numpy灵活定义神经网络结构的方法

Caffe in Python之定义网络结构和添加自定义网络层

神经元与神经网络结构

自定义一个awaiter 代码来自网络

一个神经网络

神经网络结构学习（介绍一种理解tensor结构的方法）

深度学习算法--利用tf.GradientTape自定义鸢尾花神经网络分类模型

卷积神经网络的网络结构——DenseNet

卷积神经网络的网络结构——GoogLeNet

今日推荐

周排行

3.5星|津巴多《时间的悖论》：未来导向的人更有可能取得个人的成功，但帮助他人的可能性更小

k8s无脑系列（二）-DNS服务搭建和访问

leetcode 26 从排序数组中删除重复项

Python Web 框架：Django、Flask 与 Tornado

中科院计算所研究员陈益强：越来越'聪明'的智能硬件

dotNET面试（二）

数据备份恢复

vue 路由知识点梳理及应用场景整理

ajax局部刷新流程

分段、分页&&内存碎片、外存碎片

每日归档

更多

2025-03-22(0)

2025-03-21(0)

2025-03-20(0)

2025-03-19(0)

2025-03-18(0)

2025-03-17(0)

2025-03-16(0)

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)