如果你希望检查 Unix 或 Linux 系统上的 GPU 使用情况(特别是查找空闲的 NVIDIA GPU),可以使用 NVIDIA 提供的命令行工具 nvidia-smi
。
打开终端并输入以下命令:
nvidia-smi
这个命令将输出你的 NVIDIA GPU 的当前状态,包括每个 GPU 的使用率、总内存、正在使用的内存、GPU 温度等信息。GPU 显示的内存和使用率低表明它是空闲的或正在使用较少资源。
命令 nvidia-smi
还可以通过不同的参数来获取更详细的信息。例如:
nvidia-smi --query-gpu=index,name,utilization.gpu,memory.used --format=csv
这将以 CSV 格式提供每块 GPU 的索引、名称、利用率和已使用内存。
请注意,非 NVIDIA GPU 或没有装有 NVIDIA 驱动的环境中 nvidia-smi
命令将不适用。对于其他类型的 GPU,你可能需要查找特定于供应商的工具或命令来获取使用情况信息。例如,对于 AMD GPU,可以使用 rocminfo
和 radeon-top
。对于英特尔集成图形,可以尝试 intel_gpu_top
。
另外,如果你在使用像 Kubernetes 这类容器编排系统,你可能需要查看集群的 GPU 使用情况,这通常需要集群级的监视和管理工具来获得概览。