华为云服务器搭建PaddlePaddle GPU环境

华为云服务器配置

  • 名称:GPU加速型 p1.2xlarge.8
  • CPU:Intel E5-2690V4 2.6GHz(8核)
  • GPU:NVIDIA Tesla P100(单卡,16G)
  • 内存:64G
  • 硬盘:通用型SSD 100G
  • 系统:CentOS 7.3 64bit for P100 | 公共镜像

1 显卡驱动升级

由于华为云GPU服务器自带的显卡驱动版本比较低,不适配当前新版的PaddlePaddle版本,所以先进行显卡驱动的升级。

  • 查询Nvidia-Driver版本:
	nvidia-smi
  • 查询CUDA版本:
	cat /usr/local/cuda/version.txt
  • 清除所有nvidia相关文件和依赖:
	yum remove nvidia-*
  • 为了删除干净还可以(目标就是把nvidia-driver的相关组件都清理掉):
	rpm -qa|grep -i nvid|sort
	yum  remove kmod-nvidia-*
  • 在卸除驱动后一定记得重启:
	sudo reboot
  • 到官方下载指定驱动版本文件:NVIDIA-Linux-x86_64-440.118.02.run,然后运行安装:
	sh NVIDIA-Linux-x86_64-440.118.02.run
  • 然后按照提示框一步步ok就行了,最后使用nvidia-smi查询是否升级成功:
    在这里插入图片描述

2 安装 Anaconda

Anaconda是1个常用的python包管理程序,里面可以设置好多个python环境。

  • 下载 Anaconda 安装脚本
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.05-Linux-x86_64.sh --no-check-certificate
  • 下载完成后,执行安装,会提示你阅读授权,一直按回车就可以了
sh Anaconda3-2021.05-Linux-x86_64.sh

然后提示你是否同意,输入yes
安装过程中会询问你安装的位置,一般不用更改,输入回车就行,它会自动解压缩
最后会提示是否初始化Anaconda的一些配置,记得输入yes

  • 安装好了之后,把Anaconda配置到环境变量,就可以用快捷 conda 命令了
vim ~/.bashrc #编辑环境配置文件
export PATH="~/anaconda3/bin:$PATH" # 在第一行加入这个

vim 输入 i 可以编辑,编辑好了之后按 Esc, 然后输入 :wq 保存修改

  • 保存好了之后更新环境变量,在命令行输入:
source ~/.bash_profile

最后验证一下是否配置成功,没有保存的话就是配置成功了!

  • 安装好了之后,创建一个 python3.8的环境,执行一下命令,会有一个确认,输入 y ,然后回车就可以了
conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  • 激活 paddle_env 环境
conda activate paddle_env

3 安装 git

因为经常需要从paddle仓库中下载代码,需要用到git,这里需要先把git环境安装好。

3.1 下载

进入到要下载的目录

cd /usr/local

用wegt命令进行下载

wget https://www.kernel.org/pub/software/scm/git/git-2.19.2.tar.gz

3.2 解压

在已下载的目录解压到/usr/local目录下

tar -xzvf git-2.19.2.tar.gz -C /usr/local

3.3 安装

进入解压后的git目录

cd /usr/local/git-2.19.2

执行make configure

make configure

注意:执行此命令时,开始出错,错误如下:
错误信息1:
configure: Setting lib to ‘lib’ (the default)
configure: Will try -pthread then -lpthread to enable POSIX Threads.
configure: CHECKS for site configuration
checking for gcc… no
checking for cc… no
checking for cl.exe… no
configure: error: in /opt/git-2.19.0': configure: error: no acceptable C compiler found in $PATH See config.log’ for more details
解决办法:通过yum providers gcc 和 yum providers cc 查询到c编译器没有安装,可通过执行yum -y install gcc安装gcc包及对> 应的依赖。

错误信息2:
GIT_VERSION = 2.19.2
GEN configure
bin/sh:autoconf:未找到命令
make:***[configure]错误127
解决办法:通过yum providers autoconf 查询到没有安装autoconf,可通过执行yum -y install autoconf安装包及对应的依赖。

配置目录

./configure --prefix=/usr/local/git

执行 make profix=/usr/local/git等待编译完成

make profix=/usr/local/git

注意:执行此命令时,开始出错,错误如下:
错误信息1:
* new build flags
CC credential-store.o
In file included from credential-store.c:1:0:
cache.h:20:18: fatal error: zlib.h: No such file or directory
#include <zlib.h>
compilation terminated.
make: *** [credential-store.o] Error 1
解决办法:缺少zlib库,通过sudo yum install zlib-devel安装包及对应的依赖。

执行make install进行安装

make install

3.4 加入环境变量

echo "export PATH=$PATH:/usr/local/git/bin" >> /etc/profile
source /etc/profile   //使修改的文件生效

3.5 检查版本

git --version

如果显示:git version 2.19.2 则证明安装成功!

4 安装 PaddlePaddle

PaddlePaddle 是百度开源的深度学习框架
PaddlePaddle官网:https://www.paddlepaddle.org.cn

  • 安装时根据自己的服务器配置选择对应的安装脚本
    在这里插入图片描述

  • 由于国内服务器访问Anaconda官方源可能会很慢,所以这里可以设置一下清华的镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
  • 开始安装GPU版Paddle, 也会有一个输入确认,输入y回车就好了,这里安装会有点久哦
conda install paddlepaddle-gpu==2.3.0 cudatoolkit=10.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/
  • 安装好PaddlePaddle 之后就可以开始其他安装了,例如:PaddleOCR、PaddleClas等

猜你喜欢

转载自blog.csdn.net/loutengyuan/article/details/126527326