nvidia-smi指令解析

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_25819827/article/details/78977325

对于一些游戏玩家来说买到好配置的主机,首先一件事就是拿一些跑分软件来跑个分,如3DMark,国际象棋等。
像我们搞CUDA的喜欢用NVIDIA自带可视化工具Visual Profiler 来看程序对GPU的应用效率,对于一些已经搭好的框架如tensorflow和caffe等,想到监控的方法就是在训练或者测试时直接用命令:

nvidia-smi

在终端中打印出GPU的各种属性。
如下图是打印的结果:
这里写图片描述
第一行Driver Version:384.90表示我用的驱动是384.90
第二行中:
第一行表示GPU序号,名字,Persisitence-M(持续模式状态),如我中有一个GPU序号为0;名字为GeForce系列的GTX1060;持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第一栏Fan:N/A是风扇的转速,从0到100%之间变动。有的nvidia设备如笔记本,tesla系列不是主动散热的可能显示不了转速
第二栏Temp:温度,35摄氏度
第三栏Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示最小性能地
第四栏中Pwr表示能耗,22瓦
第五栏中Bus-Id是表示GPU总线的东西
第六栏中Disp.A是DisPlay Active ,表示GPU是否有初始化
下方的Memory-Usage表示显存的使用率:共6GB 我已经使用了220MB(当初买电脑时电脑城的人一直把我往3GB显存的阉割版的1060上拉,说显存是浮动的,可能显存浮动只有像英伟达jetson系列的移动嵌入式平台上显存与内存共享的形式才能做到吧)
第七栏Volatile GPU-Util表示GPU的利用率
第八栏Uncorr.ECC是表示ECC的相关东西,ECC即 Error Correcting Code 错误检查和纠正,在服务器和工作站上的内存中才有的技术
再下面是关于进程的相关GPU使用率,如这边有三个进程对GPU进行了利用,Xorg,compiz和FireFox和各自调用时显存的使用量

猜你喜欢

转载自blog.csdn.net/qq_25819827/article/details/78977325