监控NVIDIA GPU显卡占用状态的常用命令
1.单次查看GPU状态 nvidia-smi
NVIDIA 提供的用于管理和监控 NVIDIA GPU 设备的命令行工具
可查看当前系统中 NVIDIA GPU 的使用情况、温度、内存占用等信息
[注]:Linux 和Windows都可支持此命令
nvidia-smi
2.动态监控GPU
每隔 0.5 秒执行一次nvidia-smi命令
watch -n 0.5 nvidia-smi
CTRL + C 退出命令
每隔X秒执行一次 nvidia-smi 命令,并持续显示 GPU 的使用情况。这样可以更频繁地更新 GPU 的状态信息,提供更实时的监控数据。
[注]:Linux 和MacOS支持此命令,windows不适用
windows下可使用以下命令,可达到类似效果,每秒更新一次信息,但每次都会打印一遍信息 体验不是很好
nvidia-smi -l 1
3.使用nvitop命令
nvitop 是一个基于 NVIDIA GPU 的实时性能监控工具,类似于 Linux 系统上的 top 命令。
可用于查看 GPU 的利用率、温度、内存使用情况以及其他相关信息
nvitop能够以可视化的方式展示GPU的实时数据,对于监控 GPU 的性能和状态非常有用
安装
pip install nvitop
使用
nvitop
退出
按q退出