GPU显存不共享 - 代码天地

GPU显存不共享

企业开发 2023-09-30 18:04:52 阅读次数: 0

验证：

import torch
a=torch.rand(2)
a=a.to("cuda:0")
b=a.to("cuda:1")
print(b)
# tensor([0.0, 0.0], device='cuda:1')
print(a)
# tensor([0.9285, 0.3294], device='cuda:0')

如果出现以上情况，就证明2张显卡之间内存没有共享，在跑大模型时，计算会出错。

解决方案：

一、禁用IOMMU

在Linux系统中，要禁用IOMMU（Input-Output Memory Management Unit），你需要在系统引导时修改内核参数。IOMMU用于虚拟化和硬件设备管理，因此禁用它可能会影响系统的一些功能，所以请谨慎操作，并确保你了解操作的影响。
下面是在Linux中禁用IOMMU的步骤：

1、编辑引导配置文件（GRUB或其他引导加载程序）：
打开终端并以超级用户（root）或具有sudo权限的用户身份登录。
找到你的引导加载程序配置文件。对于大多数Linux系统，这是GRUB引导加载程序。
你可以编辑GRUB配置文件，通常位于/etc/default/grub中。使用文本编辑器打开它，例如：

vim /etc/default/grub

在GRUB配置文件中，找到GRUB_CMDLINE_LINUX或类似的行，它包含了内核参数。添加intel_iommu=off或amd_iommu=off，具体取决于你的硬件供应商。这样，该行可能会像这样：

GRUB_CMDLINE_LINUX="intel_iommu=off"

GRUB_CMDLINE_LINUX="amd_iommu=off"

GRUB_CMDLINE_LINUX="iommu=pt"

2、更新引导配置：

sudo update-grub

3、重启系统：

sudo reboot

二、更新驱动

在这里插入图片描述
可以看到最新版的驱动已经修复了这个问题

猜你喜欢

转载自blog.csdn.net/weixin_46398647/article/details/133309013

GPU显存不共享

GPU显存不释放

当显存不够时是否会调用共享GPU内存？

GPU释放显存

释放GPU显存

为什么Pytorch多卡训练容易导致GPU显存不释放

Tensorflow占用GPU显存问题

树莓派设置GPU显存

cuda获取gpu当前显存

Jetson查看GPU显存信息

tensorflow设置gpu及gpu显存使用

TensorFlow指定GPU设备、分配显存

显卡、显卡驱动、显存、GPU、CUDA、cuDNN

Python查看GPU已使用的显存

深度学习中 GPU 和显存分析

Tensorflow指定GPU的指定和显存设置

Keras - GPU ID 和显存占用设定

pynvml 查看GPU已使用的显存

深度学习中GPU和显存分析

GPU优化 - Caffe 显存优化[译·转]

Linux Ubuntu释放指定GPU的显存占用

解决GPU显存未释放问题

Python 查看GPU已经使用的显存

GPU 显存不足怎么办？

TensorFlow gpu设置和显存设置

python 查看程序的GPU显存占用

排查GPU无进程但显存占用

python编程查看gpu显存使用

使用CUDA计算GPU的理论显存带宽

38、Tensorflow：tensorflow中使用指定的GPU及GPU显存

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)