跑模型的问题总结(一)

刚开始跑模型遇到了很多问题,感谢大神们的博客,自己对遇到的问题做个小总结~

一、tmux的使用:

1.新开一个会话---tmux new -s session_name
2.会话里启动进程后,回到原本界面的方法----先按下ctrl+b,然后再单独按d
3.重新回到会话里查看进程的方法:tmux a -t session_name 
4.查看会话中历史记录----先按ctrl+b,然后按Page Up ,Page Down
5.可以同时新建多个会话s1,s2,s3
   在会话间切换的命令: 先按ctrl+b ,再按s,然后就可以在会话间选择其中一个,按enter进入。
6.关闭会话的方法: tmux kill -session -t session_name

这里注意:有时ctrl+b没反应,是因为输入法在中文模式,调成英文模式就好啦

二、显卡占用问题

程序终止,但显卡仍然占用:
1.查看占用显卡的进程
fuser -v /dev/nvidia*
2.终止进程
kill -9 pid

三、执行脚本时  没有那个文件或目录

出现这个错误是因为不熟练linux编程,每次都从本机写好再上传服务器。 这是由于脚本文件在保存时使用了DOS文件(windows系统中)格式造成的,可以用vim打开文件,然后执行下列操作:
:set ff=unix
:wq

所以一定要好好熟练linux语法啊啊啊

四、卸载tensorflow

 pip uninstall protobuf
 pip uninstall tensorflow

五、Linux下环境变量PATH设置错误,导致:未找到命令

export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
echo $PATH
然后
vim ~/.bash_profile
添加PATH

六、pytorch 多GPU训练

CUDA_VISIBLE_DEVICES=2 python  程序名

https://oldpan.me/archives/pytorch-to-use-multiple-gpus  这篇更详细一些,谢谢博主~~~///(^v^)\\\~~~

猜你喜欢

转载自blog.csdn.net/xuyuan______/article/details/106247166
今日推荐