A40上tensorflow的安装

1.安装docker

sudo apt-get update  
sudo apt-get install \
   apt-transport-https \     
   ca-certificates \     
   curl \     
   gnupg-agent \     
   software-properties-common  
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -  
sudo add-apt-repository \    
   "deb [arch=amd64] https://download.docker.com/linux/ubuntu \    
   $(lsb_release -cs) \    
   stable"

2.安装docker引擎

sudo apt-get update 
sudo apt-get install docker-ce docker-ce-cli containerd.io

3.docker命令

docker的启动:sudo systemctl start docker 
docker版本:sudo docker version 
测试运行容器:sudo docker run hello-world 
查看下载的镜像:sudo docker images 
停止服务: sudo systemctl stop docker 
清空工作路径: sudo rm -rf /var/lib/docker 
查看运行的进行:sudo docker ps -a 
重启docker: sudo systemctl restart docker 
删除容器:sudo docker rm hello-world
容器删除先停止再删除
查看正在运行的镜像:docker ps -a

4.tensorflow的docker安装

tensorflow版本信息查看符号要求的版本信息,如下图:

容器链接中搜索tensorflow或者pytorch,如下图所示:

点击tensorflow可以看到详细的信息,如图:

点击Tags就可以得到各个版本的列表,如下图

点击选定版本的右上角三个点Pull Tag,可以得到tensoorflow1.5的拉取命令:

运行1:普通启动
sudo docker run --gpus all -d -it --name=tf1_test nvcr.io/nvidia/tensorflow:20.10-tf1-py3
-d : 后台运行,不是一次性
-it : 交互式(dos命令行模式)
--name : 给容器起名 tf1_test
nvcr.io/nvidia/tensorflow:20.10-tf1-py3 : 使用的镜像名称
运行2:增加映射目录:
sudo docker run --gpus all -d -it -v /home/XXX/:/XXX --name=tf15_1 nvcr.io/nvidia/tensorflow:20.10-tf1-py3
运行3:增加端口映射
sudo docker run --gpus all -d -it -v /home/XXX/:/XXX --name tf15_2 -p 6073:6073 nvcr.io/nvidia/tensorflow:20.10-tf1-py3

其中运行2会在tf15_1中含有xxx中的所有内容;运行3是可以外部直接通过接口访问tf15_2中的服务。

如下的错误由于网络的问题,可以多试几次:

进入容器:sudo docker attach tf15_1
退出容器:Ctrl + P , Ctrl + Q

 进入容器之后需要安装以及检测:

apt update 
apt install -y python3-dev python3-pip git 
pip3 install --upgrade pip setuptools requests
pip install nvidia-pyindex
pip install nvidia-tensorflow[horovod]

验证是否安装了软件包
pip list | grep nvidia
验证 TensorFlow 加载:
python -c 'import tensorflow as tf; print(tf.__version__)'
验证 TensorFlow 是否看到 GPU:
python -c "import tensorflow as tf; print('Num GPUs Available: ', len(tf.config.experimental.list_physical_devices('GPU')))

以上就可以在A40上安装低版本的tensorflow.

猜你喜欢

转载自blog.csdn.net/rucieryi369/article/details/124728286