查看空闲gpu

如果你希望检查 Unix 或 Linux 系统上的 GPU 使用情况(特别是查找空闲的 NVIDIA GPU),可以使用 NVIDIA 提供的命令行工具 nvidia-smi

打开终端并输入以下命令:

nvidia-smi

这个命令将输出你的 NVIDIA GPU 的当前状态,包括每个 GPU 的使用率、总内存、正在使用的内存、GPU 温度等信息。GPU 显示的内存和使用率低表明它是空闲的或正在使用较少资源。

命令 nvidia-smi 还可以通过不同的参数来获取更详细的信息。例如:

nvidia-smi --query-gpu=index,name,utilization.gpu,memory.used --format=csv

这将以 CSV 格式提供每块 GPU 的索引、名称、利用率和已使用内存。

请注意,非 NVIDIA GPU 或没有装有 NVIDIA 驱动的环境中 nvidia-smi 命令将不适用。对于其他类型的 GPU,你可能需要查找特定于供应商的工具或命令来获取使用情况信息。例如,对于 AMD GPU,可以使用 rocminforadeon-top。对于英特尔集成图形,可以尝试 intel_gpu_top

另外,如果你在使用像 Kubernetes 这类容器编排系统,你可能需要查看集群的 GPU 使用情况,这通常需要集群级的监视和管理工具来获得概览。

猜你喜欢

转载自blog.csdn.net/u013069552/article/details/139648902