分布式机器学习模型并行的理解two - 代码天地

分布式机器学习模型并行的理解two

其他 2020-07-27 12:12:06 阅读次数: 0

针对于模型并行，我的理解是可以把神经网络的模型拆开，每一层放到一个worker中。例如模型有三层。可以放到3个worker中。worker1、worker2、worker3。

前向传播。worker1计算完成的输出是worker2的输入。worker2和worker3同理。

self.net1 = torch.nn.Linear(10, 10).to('cuda:0')  # 将net1放置在第1个GPU上
    self.relu = torch.nn.ReLU()
    self.net2 = torch.nn.Linear(10, 5).to('cuda:1')   # 将net2放置在第2个GPU上
    self.net3 = torch.nn.Linear(10, 5).to('cuda:2')   # 将net3放置在第3个GPU上
 def forward(self, x):
    x = self.relu(self.net1(x.to('cuda:0'))
    x1= self.relu(self.net2(x.to('cuda:1'))
    return  self.net3(x.to('cuda:2'))

反向传播过程就是一层一层的反向传播。

我把它理解为这样：

这个过程应该是最low的模型分布

猜你喜欢

转载自blog.csdn.net/zhuiyunzhugang/article/details/106310955

分布式机器学习模型并行的理解two

分布式机器学习系统笔记（一）——模型并行，数据并行，参数平均，ASGD

【机器学习】LR的分布式（并行化）实现

深度学习的分布式训练--数据并行和模型并行

Spark分布式机器学习源码分析：线性模型

分布式机器学习

分布式的理解学习

【机器学习】LR的分布式（并行化）实现——理论篇

并行分布式框架 Celery 的分享理解

大模型分布式训练并行技术（一）-概述

[源码解析] 模型并行分布式训练 Megatron (3) ---模型并行实现

大规模并行分布式深度学习

【深入了解PyTorch】PyTorch分布式训练：多GPU、数据并行与模型并行

大模型分布式训练并行技术（三）-流水线并行

并行与分布式计算第八章并行计算模型

分布式机器学习的故事

Tensorflow分布式机器学习平台

分布式机器学习dask

分布式机器学习框架

分布式机器学习(Parameter Server)

深度学习分布式模型

PAI分布式机器学习平台编程模型演进之路

Spark MLlib分布式机器学习源码分析：集成树模型

Spark MLlib分布式机器学习源码分析：线性模型

SparkMLlib中的大规模机器学习：分布式模型训练和部署

分布式的理解

分布式理解

分布式机器学习第3章分布式机器学习框架

并行与分布式计算导论（二）编程模型与硬件模型

分布式，网格及并行计算

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)